Slot-Intent识别任务
我要去北京的飞机票
Domain(optional):Travel
Intent:Order Ticket
Slot:destCity=北京
Slot-Intent识别任务
| 模型 | 差异 | |
|---|---|---|
| NER | CRF,Bi-LSTM(SOTA) | 没有Intent,无法联合训练; |
| Slot/Intent | Seq2Seq,Bi-LSTM(SOTA) | 有Intent可以联合训练,很多时候是人工构造数据,专攻特定领域; |
| 中文分词(Word Seg) | Bi-LSTM(SOTA) | 不用CRF和Seq2Seq;数据集差异性大; |
以前的工作
Attention-Based Recurrent Neural Network Models for Joint Intent Detection and Slot Filling (Bing Liu, Ian Lane, 2016)
特点:
1、取消了Output部分的前向依赖
2、增加了有Intent信息参与的Slot Gate
计算Attention
Slot Atten
Intent Atten
Intent Ouput
Slot Output
Intent Atten
Slot Atten
Slot Gate
Slot Gate
Intent Attention Only
Result
ATIS比Snips用Full Atten的效果差,作者认为可能是ATIS数据集比较小,完成任务的所需信息并不需要那么多