2018-06-14

学術論文からNLPを用いてファクトを抜き出す

論文からファクトを抜き出す技術についてこんなやりとりが全脳アーキテクチャであった。

紹介されている論文については今週読む。

山川宏 ― 全脳アーキテクチャ -whole brain architecture-

どなたかご存知の方にお聞きしたいのですが、
神経科学・医療・生物学系などの論文から、自然言語処理でファクトを抜き出すような技術は今はどのあたりまでできるようになっているのだろうか？たとえば、「海馬CA1 contains 場所細胞」とか抜き出せるとか。
そうではなくて、むしろデータベース化が進んでいるとか？

2,005年くらいのBioinformaticsの状況は知っているが、DL以降はどのくらい良くなったか知らないもので。。。

コメントする

あなたと他7人

他1件のコメントを表示

中川裕志深層学習がよいという話はありえそうですが、こういう難しい問題に適用して成功した話は私は聞いていない（ただし、私はもはや自然言語の研究者でないので、嘘を言っているかもしれないです

😅）
ちなみに機械翻訳は深層学習で劇的に改善しましたが、実は意味を理解して翻訳しているわけではないので、異なるメディアの間での変換という形になるので、かなり楽なケース。（注：日本語というメディアから英語というメディアへという意味）

管理する

いいね！他のリアクションを見る

返信1時間前

秋山理昨年kaggle において分子生物学の論文のテキスト情報からその論文で扱われている遺伝子の性質を判別するコンペティションが開かれています。
https://www.kaggle.com/c/msk-redefining-cancer-treatment管理する

KAGGLE.COM

Personalized Medicine: Redefining Cancer Treatment

返信1時間前

礼王懐成意味解析の分野で、AMR(Abstract Meaning Representation)が最近注目されおり、述語項構造＋概念情報（固有名詞、時間情報などのエンティティ）＋　文脈情報（共参照，談話構造）についての情報表現ができるのが特徴です。
ARMとLSTMを組み合わせた研究もあり、以下の論文のようにBiomedical イベント情報抽出などにも応用されています。
http://www.aclweb.org/anthology/W17-2315

管理する

返信39分前

2018-06-14

np.dot(a, b)で計算できるaとbの組み合わせ

内積計算において、次元を合わせる作業は必須である。

しかし、np.dotにおいては１次元配列と多次元配列の計算においてはなぜか次元が合わなくても計算できてしまう現象が発生する。

本記事の目的は、np.dot(a,b)で次元が合わなくても計算が実行される際、どんな計算が行われているのかを実験により明らかにすることである。

実験1

x = [[1,2,3],[2,3,4]] #(2,3)
W = [[1,3,4],[2,3,4],[2,3,4]] # (3,3)
np.dot(W, x)

ValueError: shapes (3,3) and (2,3) not aligned: 3 (dim 1) != 2 (dim 0)


実験2
x = [[1,2,3],[2,3,4]] #(2,3)
W = [[1,3,4],[2,3,4],[2,3,4]] # (3,3)
np.dot(x, W)

array([[11, 18, 24],
       [16, 27, 36]])


実験3
x = [1,2,3] #(1,3)
W = [[1,3,4],[2,3,4],[2,3,4]] # (3,3)
np.dot(W, x)

array([19, 20, 20])

実験4
x = [1,2,3] #(1,3)
W = [[1,3,4],[2,3,4],[2,3,4]] # (3,3)
np.dot(x, W)

array([11, 18, 24])




実験5

f:id:barisuke:20180614111955p:plain

実験6
x = [[1],[2],[3]] #(1,3)
W = [[1,3,4],[2,3,4],[2,3,4]] # (3,3)
np.dot(W, x)

array([[19],
       [20],
       [20]])



実験1,2より 
多次元配列と多次元配列の計算の場合は、引数の順番を合わせる/またはtransposeすることにより次元を合わせる必要がある　

実験3,4より
一次元配列と多次元配列の計算の場合は、次元が合わない場合勝手にtransposeが起こる。

ということがわかった。

つまり、

np.dot()において

次元が合わなくても計算ができてしまうのは

1次元配列と多次元配列の内積計算の時のみで、その時は１次元配列の転置が自動的に行われるということである。