ChinaXiv.org 中国科学院科技论文预发布平台

注册登录

EN | 中文

按提交时间

2022
1

按主题分类

情报过程自动化的方法和设备
1

按作者

按机构

当前资源共 1条

隐藏摘要

点击量

时间

1. ChinaXiv:202209.00004
下载全文

基于文本生成技术的历史古籍事件识别模型构建研究

分类：图书馆学、情报学 >> 情报过程自动化的方法和设备提交时间： 2022-08-31

王彦莹王昊朱惠李晓敏

摘要：目的对比序列标注方法和文本生成方法在历史古籍事件识别上的表现，以构建历史古籍事件识别模型。方法本文选取《三国志》为原始语料，序列标注实验对《三国志》事件数据集进行BMES标注，构建BBCN-SG模型，文本生成实验构建T5-SG模型，对比两种方法的表现。又构建RoBERTa-SG、NEZHA-SG模型展开生成模型的对比实验。结合三个文本生成模型，融入Stacking集成学习的思想，构建Stacking-TRN-SG模型。结果在历史古籍事件识别建模问题上，文本生成方法的表现明显优于序列标注方法。而在文本生成方法中，三个模型表现则是RoBERTa-SG > T5-SG > NEZHA-SG。Stacking集成学习大大提高了生成模型的识别效果。局限本文计算资源有限，Stacking-TRN-SG模型缺少在其他历史古籍语料中的应用研究。结论本文构建的Stacking-TRN-SG模型初步实现历史古籍的自动事件识别。

通过

点击量 2182 下载量 289 评论

友情链接: PubScholar 哲学社会科学预印本

运营单位: 中国科学院文献情报中心
制作维护：中国科学院文献情报中心知识系统部
邮箱: eprint@mail.las.ac.cn
地址：北京中关村北四环西路33号

招募志愿者许可声明法律声明

京ICP备05002861号-25 | 京公网安备110402500046号
版权所有© 2016 中国科学院文献情报中心