AI CUP論文分類競賽參賽心得

分享人: 楊平

日期: 2020/03/27

題目

資料來源: Arxiv網站上的論文資料

任務: 利用人工智慧將論文進行自動多類別分類(multi label classification)

可以同屬多類別

總計7000筆

總計20000筆

平台: google colaboratory

神經網路架構: XLNet (BERT的一種)

預訓練模型: uncased_L-12_H-768_A-12

(12-layer, 768-hidden, 12-heads, 110M parameters)

Pre-training of Deep Bidirectional Transformers for Language Understanding

Transfer Learning

資料只留Abstract

epoch = 6

max seq length = 512

batch size = 16

測試成績 0.6958947788

資料為Title以及被標示為研究方法的句子

epoch = 12

max seq length = 512

batch size = 16

測試成績 0.6982248521

神經網路架構一樣是BERT

預訓練模型: SciBERT (利用科學資料train的model)

前 3 epoch對SciBERT進行fine tune

後 10 epoch凍結SciBERT，對最後一層進行訓練