barilog

エンジニアリング見習い雑記

2018-08-01から1ヶ月間の記事一覧

【論文読み】Sentiment-Based Prediction of Alternative Cryptocurrency Price Fluctuations Using Gradient Boosting Tree Model

今手元に仮想通貨関係のInfluencerたちの発したtweetとBTC価格のデータセットがあるのですが,ここからBTC価格に影響のありそうなtweetを抽出し,さらにwweetからBTC価格の上下を当てる,,なんてことを研究で行っています. 一旦はeventstudyでBTC価格に影…

入江開発室に入ってみた

入江開発室って知ってますか?最近twitterなどで徐々に認知度が上がっている開発者向けのオンラインサロンです camp-fire.jp 色んなプロジェクトが並行して走っていて,サロンメンバーは好きなプロジェクトに参加できるようになっています. このオンライン…

pickleでセッション情報も保存できたらな〜というとき

pickleの代わりにdillをつかうとセッション情報を保存できるらしい. qiita.com

webビデオ会議システム

webビデオ会議のシステムを作ってみた Web Conferencing System

金融テキストマイニングにおけるモデルの評価

コーパスとテキストマイング http://amzn.asia/2IbDzDK の読書メモ モデルの評価の基礎的な流れは以下のとおりです. 1.訓練データからモデルを学習する 2.評価データの説明変数をモデルに入力し評価データの目的変数の値を推測する. 3.実際の評価データの…

金融テキストマイニングにおけるモデルの評価

コーパスとテキストマイング http://amzn.asia/2IbDzDK の読書メモ モデルの評価の基礎的な流れは以下のとおりです. 1.訓練データからモデルを学習する 2.評価データの説明変数をモデルに入力し評価データの目的変数の値を推測する. 3.実際の評価データの…

論文 Twitter mood predicts the stock market

コーパスとテキストマイニングより引用 --------------------------------------------------------------------------------------------------- Bollenら(2011)は,2008年2月28日から11月28日の9,853,493個のtwitterのテキストを分析し,米国の…

BOWのデータフレームを作る簡単な方法

シンプルなテーマだが,あまり情報がなかったので調べてみた.なんらかテキスト集合からBag Of Words,つまり(単語ID, 出現回数)の集合を作る方法はよく情報提供がなされている. よく提供されている方法としてgensimのcorporaを使ったものがあるが,そこ…

オフラインでもssh接続を維持するために

awsなどのサーバーにssh接続した上で時間のかかる処理をしている場合, 基本的にパソコンをwifi環境から外してしまうとssh接続が途切れる. 10時間ぐらいかかるプログラムを回していて終電にぶちあたってしまったときなどは大変だ. そういうときの対策を…

ubuntuでpipでインストールしたライブラリを使いたいのにパスが通っていない,,

という場合のの対処法 結論から言えば 以下のように site-packagesのパスを調べて sys.pathに追加してあげればOK!! #ライブラリのパスを設定 import sys sys.path.append("/home/ubuntu/anaconda3/lib/python3.6/site-packages") site-packagesのパスは使っ…

mecabによるtokenize中に起こるUnicodeDecodeErrorの解決

import MeCab#mecab = MeCab.Tagger(' -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd')mecab = MeCab.Tagger('mecabrc -u expert.dic') import re from bs4 import BeautifulSoup from urllib.request import urlopen # ストップワードを定義def make_s…

PandasのDataFrameの行を反復処理する方法は?

[Python] PandasのDataFrameの行を反復処理する方法は? rows | CODE Q&A [日本語] こちらのサイトを参考にした. 1.行をSeriesとして取り出す方法 DataFrame.iterrows()を使う 例 for row in df.iterrows(): print("c1 :",row["c1"],"c2 :",row["c2"]) 2.行…