分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-04-13
摘要: 目的/意义 对先秦典籍中植物进行知识挖掘,构建先秦典籍植物知识图谱,对认识我国古代人民社会和生活状态等具有重要意义。 方法/过程 对先秦典籍中植物词进行详尽标注与计量分析。基于CRF和多种深度学习模型构建古汉语植物命名实体识别模型,比较分析各模型性能以确定最优模型;设计了面向知识图谱的古汉语植物知识组织模式。 结果/结论 基于领域预训练语言模型SikuRoBERTa构建的古汉语植物命名实体识别模型性能最优,调和平均值达85.44%,为基于实体的植物知识挖掘提供了有效方法;构建了先秦典籍植物知识图谱,实现了对先秦典籍中植物实体及其关联知识的聚合与可视化呈现。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》
摘要: [目的/意义] 基于古籍数字化和古文智能处理的古籍人文计算研究,是近年来古文信息处理的新焦点,而以数据为基础的量化分析方法能为古籍相关的传统研究问题带来新的视角和思路。[方法/过程] 以《春秋》三传中女性人物为研究对象,以多角度的女性人物知识标注为数据来源,进行了包括女性人物姓、国、氏、排行、谥号、尊称和年份分布的女性人物知识量化分析,以及以女性人物知识为线索的以联姻参与度为主的诸侯国联姻关系量化分析。[结果/结论] 对《春秋》三传女性人物进行了新角度的解读,提供了一种可度量、可视化的研究思路,为相关研究提供了可信的数据验证。