Distributed Representations of Sentences and Documents

2016-10-18 TSG 機械学習分科会 第2回論文読み会

@hakatashi

要訳をQiitaに投稿しました

Paragraph Vector

word2vecを任意長の単語に
応用したもの

paragraph2vecとも呼ばれる

スライドを作るより
要訳を読み上げたほうが
いいことに気付いた

おまけ

word2vecの論文で
評価手法として使われた
MSR Sentence Completion Challenge

MSRのページから
ダウンロードできる

わざわざ
人間用のフォーマット(human)も
用意されている

やってみた

Architecture Accuracy [%] 
4-gram 39
Average LSA similarity 49
Log-bilinear model 54.8
RNNLMs 55.4
Skip-gram 48.0
Skip-gram + RNNLMs 58.9

hakatashi

32

機械には
勝てなかったよ……

おしまい

Distributed Representations of Sentences and Documents

By Koki Takahashi

Distributed Representations of Sentences and Documents

2016-10-18 TSG 機械学習分科会 第2回論文読み会

  • 2,134