分享人: 楊平
日期: 2020/03/27
資料來源: Arxiv網站上的論文資料
任務: 利用人工智慧將論文進行自動多類別分類(multi label classification)
可以同屬多類別
總計7000筆
總計20000筆
平台: google colaboratory
神經網路架構: XLNet (BERT的一種)
套件: fast-bert
預訓練模型: uncased_L-12_H-768_A-12
(12-layer, 768-hidden, 12-heads, 110M parameters)
Pre-training of Deep Bidirectional Transformers for Language Understanding
Transfer Learning
資料只留Abstract
epoch = 6
max seq length = 512
batch size = 16
測試成績 0.6958947788
資料為Title以及被標示為研究方法的句子
epoch = 12
max seq length = 512
batch size = 16
測試成績 0.6982248521
神經網路架構一樣是BERT
預訓練模型: SciBERT (利用科學資料train的model)
前 3 epoch對SciBERT進行fine tune
後 10 epoch凍結SciBERT,對最後一層進行訓練