利用迁移学习精准识别领域信息之探讨
后印本
Discussion on Using Transfer Learning to Accurately Identify Domain Information
-
作者:
陆泉
1,2
郝志同
1
陈静
3
陈仕
1
朱安琪
1
-
作者单位:
-
提交时间:2023-04-01 16:02:47
摘要: [目的/意义] 将从互联网大数据中无监督学习的结果迁移到目标领域,解决目标领域因学习样本有限而信息识别效果难以提升的问题。[方法/过程] 使用以中文维基百科等数据预训练的RoBERTa模型进行迁移学习,将学习结果映射到目标领域后使用DPCNN对其进行聚合凝练,然后结合部分标注数据微调模型完成领域信息的精准识别。[结果/结论] 在10个领域内与未进行迁移学习的模型及经典模型TextCNN对比,提出的模型均较大幅度优于对比模型,平均后的精确率绝对提高4.15%、3.43%,召回率绝对提高4.55%、3.44%,F1分数绝对提高4.52%、3.44%,表明利用网络大数据迁移学习可以显著提升目标领域的信息识别效果。
版本历史
[V1] |
2023-04-01 16:02:47 |
ChinaXiv:202304.00684V1
|
下载全文 |