arXiv ACL2018に参加した
最初の論文
Probabilistic FastText for Multi-Sense Word Embeddings
Sentence-State LSTM for Text Representation
センテンスのベクトル表現を獲得する手法
Takanori Nakai, Data scientist at D2c | SlideShare
のスライドが参考になる
知識ベースの情報を組み込んだ
Effective Pythonのまとめ
pythonコードを綺麗に書く方法を学ぶために、こちらの本を借りました。
Effective pythonです。
項目1: 使っているPythonのバージョンを知っておく
項目2: PEP8スタイルガイドに従う
項目3: bytes, str, unicodeの違いを知っておく
項目4: 複雑な式の代わりにヘルパー関数を書く
こちらを参照
Effective Pyhton メモ 項目4 複雑な式の代わりにヘルパー関数を書く
項目5: シーケンスをどのようにスライスするか知っておく
項目6: 一つのスライスでは,start, end, strideを使わない
項目7:
ubuntuへのmysqlのインストール
こちらでできる
以上!!!!!
その際に参照すべきはこちらのぺーじかな
Python3 データをMySQLに挿入する|Review of My Life
mysqlというモジュールがみつからん!というお叱りを頂いた場合、pathの設定がうまくいってないです。
こちらを参照にpipのsite-packagesのパスを把握し、
import sys
sys.path.append("パス")
でパスを追加しましょう
上記で環境構築は終了です
次に実際にpythonとmysqlを連携させてテーブルの中身をデータフレームに入れるコードを掲示します!
#ライブラリのインポート
import mysql.connector
import pandas as pd
conn = mysql.connector.connect(
user ='root',
passwd = 'パスワード',
host = 'localhost',
db = 'データベース名')
df = pd.read_sql("SELECT * FROM テsample_table",con=conn)
これでおっけー!
参考
オープンイノベーションスペースでの施策案かきなぐり
どうもbarisukeです。
今自分はlabcafeというコワーキングスペース
の学生スタッフをやっております。
ここはコンセプトとして
・夜ゆっくりできる居心地が良い場所
・肩書きに関係のない仲間を見つけられる場所
・仲間とともに何かに挑戦できる場所
があります。
・夜ゆっくりできる居心地が良い場所
に関しては非常によく実現できていると思います。過去現在の学生スタッフのリーダーが頑張ってくれました。
・仲間とともに何かに挑戦できる場所
・肩書きに関係のない仲間を見つけられる場所
この2つがまだ不十分ですね。
まず
・肩書きに関係のない仲間を見つけられる場所
を実現するための施策をいくつか考えていたいと思います。
a. 国際交流センターに掲示を出す
b.利用者の専門・興味分野の本を展示
c.facebookコミュニティまたは黒板で他己紹介/自己紹介/特定分野の紹介を行った場合メニューのサービス (きっとコミュニティ内に学生と絡みたいけど機会がないOBOG、自分の自己紹介をするのは恥ずかしいが自分の知っているすごい人を紹介したい人はいるはずだ)
d.(スペース内の使われていない席に対して)配置変更&電源タップ設置などの利用促進
e.スペース利用規約の更新
f.ipadを用いた映像撮影(500円とか) 要三脚 ->イベントは撮影してコミュニティページにアップロードするのをデフォにする(ちゃんと許可はとる)。 http://amzn.asia/iSUibXYこれとかつかって
らへんですかね。
次に
・仲間とともに何かに挑戦できる場所
を実現する施策に関して書いていきたい。
a. いろんな分野の挑戦体験談を語るイベントを開く。
b.利用者の思う呼びたい人、聞きたい話のリストを作成
c.留学生のピッチイベントの開催
d.仲間募集掲示の作成
とかですかね。
あと単純に上で挙げたコンセプトの周知が足りてないとおもいます。
HPを編集してもっと反映させたいですね。
終わり。
学術論文からNLPを用いてファクトを抜き出す
どなたかご存知の方にお聞きしたいのですが、
神経科学・医療・生物学系などの論文から、自然言語処理でファクトを抜き出すような技術は今はどのあたりまでできるようになっているのだろうか?たとえば、「海馬CA1 contains 場所細胞」とか抜き出せるとか。
そうではなくて、むしろデータベース化が進んでいるとか?
2,005年くらいのBioinformaticsの状況は知っているが、DL以降はどのくらい良くなったか知らないもので。。。
np.dot(a, b)で計算できるaとbの組み合わせ
np.dot(a, b)で計算できるaとbの組み合わせ
内積計算において、次元を合わせる作業は必須である。
しかし、np.dotにおいては1次元配列と多次元配列の計算においてはなぜか次元が合わなくても計算できてしまう現象が発生する。
本記事の目的は、np.dot(a,b)で次元が合わなくても計算が実行される際、どんな計算が行われているのかを実験により明らかにすることである。
実験1
x = [[1,2,3],[2,3,4]] #(2,3)
W = [[1,3,4],[2,3,4],[2,3,4]] # (3,3)
np.dot(W, x)
ValueError: shapes (3,3) and (2,3) not aligned: 3 (dim 1) != 2 (dim 0)
実験2
x = [[1,2,3],[2,3,4]] #(2,3)
W = [[1,3,4],[2,3,4],[2,3,4]] # (3,3)
np.dot(x, W)
array([[11, 18, 24], [16, 27, 36]])
実験3
x = [1,2,3] #(1,3)
W = [[1,3,4],[2,3,4],[2,3,4]] # (3,3)
np.dot(W, x)
array([19, 20, 20])
実験4
x = [1,2,3] #(1,3)
W = [[1,3,4],[2,3,4],[2,3,4]] # (3,3)
np.dot(x, W)
array([11, 18, 24])
実験5
実験6
x = [[1],[2],[3]] #(1,3)
W = [[1,3,4],[2,3,4],[2,3,4]] # (3,3)
np.dot(W, x)
array([[19], [20], [20]])
実験1,2より
多次元配列と多次元配列の計算の場合は、引数の順番を合わせる/またはtransposeすることにより次元を合わせる必要がある
実験3,4より
一次元配列と多次元配列の計算の場合は、次元が合わない場合勝手にtransposeが起こる。
ということがわかった。
つまり、
np.dot()において
次元が合わなくても計算ができてしまうのは
1次元配列と多次元配列の内積計算の時のみで、その時は1次元配列の転置が自動的に行われるということである。