注册 登录
EN | CN
  • 首页
  • 论文提交
  • 论文浏览
  • 论文检索
  • 个人中心
  • 帮助
按提交时间
  • 1
按主题分类
  • 1
按作者
  • 1
  • 1
  • 1
  • 1
按机构
  • 1
  • 1
当前资源共 1条
隐藏摘要 点击量 时间 下载量
  • 1. ChinaXiv:202209.00004
    下载全文

    基于文本生成技术的历史古籍事件识别模型构建研究

    分类: 图书馆学、情报学 >> 情报过程自动化的方法和设备 提交时间: 2022-08-31

    王彦莹 王昊 朱惠 李晓敏

    摘要: 目的 对比序列标注方法和文本生成方法在历史古籍事件识别上的表现,以构建历史古籍事件识别模型。 方法 本文选取《三国志》为原始语料,序列标注实验对《三国志》事件数据集进行BMES标注,构建BBCN-SG模型,文本生成实验构建T5-SG模型,对比两种方法的表现。又构建RoBERTa-SG、NEZHA-SG模型展开生成模型的对比实验。结合三个文本生成模型,融入Stacking集成学习的思想,构建Stacking-TRN-SG模型。 结果 在历史古籍事件识别建模问题上,文本生成方法的表现明显优于序列标注方法。而在文本生成方法中,三个模型表现则是RoBERTa-SG > T5-SG > NEZHA-SG。Stacking集成学习大大提高了生成模型的识别效果。 局限 本文计算资源有限,Stacking-TRN-SG模型缺少在其他历史古籍语料中的应用研究。 结论 本文构建的Stacking-TRN-SG模型初步实现历史古籍的自动事件识别。

    同行评议状态:待评议

     点击量 3361  下载量 796  评论 0
友情链接 : PubScholar 哲学社会科学预印本
  • 运营单位: 中国科学院文献情报中心
  • 制作维护:中国科学院文献情报中心知识系统部
  • 邮箱: eprint@mail.las.ac.cn
  • 地址:北京中关村北四环西路33号
招募预印本评审专家 许可声明 法律声明

京ICP备05002861号-25 | 京公网安备110402500046号
版权所有© 2016 中国科学院文献情报中心