王勻、林尚廷、林秉軒
Comment Bot
讓機器人在網路上到處根據貼文留言
一句話證明你是會計系的 \(\Rightarrow\) 三大報表會不會?
AI換臉真是偉大的發明啊! \(\Rightarrow\) 真的偉大發明
工程車輪胎爆胎怎麼辦? \(\Rightarrow\) 叫工程師換輪胎呀
question
separated words
word cut
word2vec
encoded vectors
AI換臉真是偉大的發明啊!
AI,換臉,真是,偉大,的,發明,啊,!
RNN
vectors representing corresponding answer
encoded vectors
直接下載維基百科公開的備份檔,以訓練gensim模型
句子
單字
向量
回應
句子
單字
向量
回應
句子
單字
向量
回應
句子
單字
向量
回應
generate similar
句子
單字
向量
回應
句子
單字
向量
回應
句子
單字
向量
回應
LSTM
LSTM
LSTM
LSTM
LSTM
encoded
POST
句子
單字
向量
回應
LSTM
LSTM
LSTM
LSTM
LSTM
encoded
COMMENT
句子
單字
向量
回應
句子
單字
向量
回應
PTT 語料庫
comment bot 的回答
Q: 地震會先上網PO文通常哪種人? A: 笑勇迷水準整天罵人垃圾
Q: 地震會先上網PO文通常哪種人? A: 痛快勇迷水準整天罵人一堆
Q: 打得贏肥宅 T: 打不贏重力繞著肥宅做圓周運動
Q: 打得贏肥宅 A: 打不贏重力繞著肥宅做弧度運動
Q: 留髮留頭 A: 還好早禿頭
Q: 留髮留頭 A: 還好之前禿頭
停用詞(stop words)通常不具意思,在做NLP有時會將他移除。為了訓練容易,這裡的模型將停用詞移除詞庫
句子
單字
向量
回應
八卦版的對答時常不合邏輯,因此需要一般對話的語料庫先行訓練,再以八卦版的對話微調(仍在蒐集語料庫)
停用詞的加入使模型訓練結果較差,應以演算法輔助解決
目前仍無法以客觀的數據表示結果得好壞,僅以人為方式評估