ChinaXiv.org 中国科学院科技论文预发布平台

注册登录

EN | 中文

按提交时间

2023
1

按主题分类

情报学
1

按作者

按机构

当前资源共 1条

隐藏摘要

点击量

时间

您选择的条件: 陈仕

1. ChinaXiv:202304.00684
下载全文

利用迁移学习精准识别领域信息之探讨

分类：图书馆学、情报学 >> 情报学提交时间： 2023-04-01 合作期刊: 《图书情报工作》

陆泉郝志同陈静陈仕朱安琪

摘要： [目的/意义] 将从互联网大数据中无监督学习的结果迁移到目标领域，解决目标领域因学习样本有限而信息识别效果难以提升的问题。[方法/过程] 使用以中文维基百科等数据预训练的RoBERTa模型进行迁移学习，将学习结果映射到目标领域后使用DPCNN对其进行聚合凝练，然后结合部分标注数据微调模型完成领域信息的精准识别。[结果/结论] 在10个领域内与未进行迁移学习的模型及经典模型TextCNN对比，提出的模型均较大幅度优于对比模型，平均后的精确率绝对提高4.15%、3.43%，召回率绝对提高4.55%、3.44%，F1分数绝对提高4.52%、3.44%，表明利用网络大数据迁移学习可以显著提升目标领域的信息识别效果。

点击量 205 下载量 103 评论

友情链接: PubScholar 哲学社会科学预印本

运营单位: 中国科学院文献情报中心
制作维护：中国科学院文献情报中心知识系统部
邮箱: eprint@mail.las.ac.cn
地址：北京中关村北四环西路33号

招募预印本评审专家许可声明法律声明

京ICP备05002861号-25 | 京公网安备110402500046号
版权所有© 2016 中国科学院文献情报中心