• 基于语义融合与模型蒸馏的农业实体识别

    分类: 农、林、牧、渔 >> 农、林、牧、渔业科学其他学科 提交时间: 2023-02-17 合作期刊: 《智慧农业(中英文)》

    摘要: 当前农业实体识别标注数据稀缺,部分公开的农业实体识别模型依赖手工特征,实体识别精度低。 虽然有的农业实体识别模型基于深度学习方法,实体识别效果有所提高,但是存在模型推理延迟高、参数 量大等问题。本研究提出了一种基于知识蒸馏的农业实体识别方法。首先,利用互联网的海量农业数据构 建农业知识图谱,在此基础上通过远程监督得到弱标注语料。其次,针对实体识别的特点,提出基于注意 力的BERT层融合模型(BERT-ALA),融合不同层次的语义特征; 结合双向长短期记忆网络(BiLSTM) 和 条件随机场CRF,得到BERT-ALA+BiLSTM+CRF模型作为教师模型。最后,用BiLSTM+CRF模型作为学生 模型蒸馏教师模型,保证模型预测耗时和参数量符合线上服务要求。在本研究构建的农业实体识别数据集 以及两个公开数据集上进行实验,结果显示,BERT-ALA+BiLSTM+CRF 模型的macro-F1 相对于基线模型 BERT+ BiLSTM+CRF平均提高1%。蒸馏得到的学生模型BiLSTM+CRF的macro-F1相对于原始数据训练的模 型平均提高3.3%,预测耗时降低了33%,存储空间降低98%。试验结果验证了基于注意力机制的BERT层融 合模型以及知识蒸馏在农业实体识别方面具有有效性。