您当前的位置: > 详细浏览

基于语义融合与模型蒸馏的农业实体识别

请选择邀稿期刊:

Agricultural Named Entity Recognition Based on Semantic Aggregation and Model Distillation

摘要: 当前农业实体识别标注数据稀缺,部分公开的农业实体识别模型依赖手工特征,实体识别精度低。 虽然有的农业实体识别模型基于深度学习方法,实体识别效果有所提高,但是存在模型推理延迟高、参数 量大等问题。本研究提出了一种基于知识蒸馏的农业实体识别方法。首先,利用互联网的海量农业数据构 建农业知识图谱,在此基础上通过远程监督得到弱标注语料。其次,针对实体识别的特点,提出基于注意 力的BERT层融合模型(BERT-ALA),融合不同层次的语义特征; 结合双向长短期记忆网络(BiLSTM) 和 条件随机场CRF,得到BERT-ALA+BiLSTM+CRF模型作为教师模型。最后,用BiLSTM+CRF模型作为学生 模型蒸馏教师模型,保证模型预测耗时和参数量符合线上服务要求。在本研究构建的农业实体识别数据集 以及两个公开数据集上进行实验,结果显示,BERT-ALA+BiLSTM+CRF 模型的macro-F1 相对于基线模型 BERT+ BiLSTM+CRF平均提高1%。蒸馏得到的学生模型BiLSTM+CRF的macro-F1相对于原始数据训练的模 型平均提高3.3%,预测耗时降低了33%,存储空间降低98%。试验结果验证了基于注意力机制的BERT层融 合模型以及知识蒸馏在农业实体识别方面具有有效性。

版本历史

[V1] 2023-02-17 22:25:07 ChinaXiv:202302.00216V1 下载全文
点击下载全文
预览
许可声明
metrics指标
  •  点击量371
  •  下载量140
评论
分享