【論文読み】Sentiment-Based Prediction of Alternative Cryptocurrency Price Fluctuations Using Gradient Boosting Tree Model
今手元に仮想通貨関係のInfluencerたちの発したtweetとBTC価格のデータセットがあるのですが,ここからBTC価格に影響のありそうなtweetを抽出し,さらにwweetからBTC価格の上下を当てる,,なんてことを研究で行っています.
一旦はeventstudyでBTC価格に影響のありそうなtweetを抽出するとこまではできたのですが(色々問題あり),肝心のBTC価格の上下を回帰で当てようとする部分が精度が低すぎて使い物になりませんでした..
これより,tweet->BTC価格の回帰
に役立ちそうな論文をあさっていました.
色々サーチしたところ
こちらの論文
が非常に参考になりそうだったので読んでみました.
submmitが2018/3で被引用数が4回,arxXivに登録されています.
論文の内容をまとめると
特徴量作成で感情分析を,回帰モデルとしてxgboostを用いてZClassicの価格を回帰分析してみたところ,相関係数が0.81になった
ということでした.
相関係数がなかなか高いですね.
特徴量は以下の6つのようです.
一時間あたりの取引数,Neutral, Positive, Negative, Unweighted Index, Weighted Index
このうち
Neutral, Positive, Negativeはおそらくonehotベクトルだと思います..
Unweighted IndexとWeighted Indexがまだよく理解できていません..