利用迁移学习精准识别领域信息之探讨后印本

Discussion on Using Transfer Learning to Accurately Identify Domain Information

作者： 陆泉 ^1,2 郝志同 ¹ 陈静 ³ 陈仕 ¹ 朱安琪 ¹
作者单位：

1. 武汉大学信息资源研究中心武汉 430072

2. 国土资源部城市土地资源监测与仿真重点实验室深圳 518034

3. 华中师范大学信息管理学院武汉 430079
提交时间：2023-04-01 16:02:47

摘要: [目的/意义] 将从互联网大数据中无监督学习的结果迁移到目标领域，解决目标领域因学习样本有限而信息识别效果难以提升的问题。[方法/过程] 使用以中文维基百科等数据预训练的RoBERTa模型进行迁移学习，将学习结果映射到目标领域后使用DPCNN对其进行聚合凝练，然后结合部分标注数据微调模型完成领域信息的精准识别。[结果/结论] 在10个领域内与未进行迁移学习的模型及经典模型TextCNN对比，提出的模型均较大幅度优于对比模型，平均后的精确率绝对提高4.15%、3.43%，召回率绝对提高4.55%、3.44%，F1分数绝对提高4.52%、3.44%，表明利用网络大数据迁移学习可以显著提升目标领域的信息识别效果。

迁移学习信息识别 RoBERTa

期刊： 图书情报工作
分类： 图书馆学、情报学 >> 情报学
引用： ChinaXiv:202304.00684 (或此版本 ChinaXiv:202304.00684V1)
DOI:10.12074/202304.00684V1
CSTR:32003.36.ChinaXiv.202304.00684.V1
推荐引用方式： 陆泉,郝志同,陈静,陈仕,朱安琪.(2023).利用迁移学习精准识别领域信息之探讨.图书情报工作.[ChinaXiv:202304.00684] (点此复制)

版本历史

[V1]

2023-04-01 16:02:47

ChinaXiv:202304.00684V1

下载全文

相关论文推荐

1. SCI来源期刊载文量和影响因子的动态变化及载文量对影响因子的影响	2024-06-25
2. 突尼斯如何发展传统手工业	2024-06-19
3. 国际社会热议中国经济发展优势	2024-06-19
4. 基于CiteSpace的新质生产力研究现状及热点可视化分析	2024-06-11
5. 科技论文数据库作者识别号的适用性研究	2024-06-06
6. Hindawi期刊批量撤销论文分析	2024-06-05
7. 中华体育精神知识图谱分析	2024-06-03
8. 农村公共文化服务助推我国乡村振兴的模式探索与价值创新	2024-06-02
9. AIGC 赋能智慧图书馆建设:基础、特征、场景及策略	2024-06-02
10. 前景·质素·路径:ChatGPT 赋能智慧图书馆建设研究	2024-06-02


公开评论匿名评论仅发给作者

利用迁移学习精准识别领域信息之探讨 后印本

版本历史

相关论文推荐

利用迁移学习精准识别领域信息之探讨后印本