分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-04-13
摘要: 目的/意义 对先秦典籍中植物进行知识挖掘,构建先秦典籍植物知识图谱,对认识我国古代人民社会和生活状态等具有重要意义。 方法/过程 对先秦典籍中植物词进行详尽标注与计量分析。基于CRF和多种深度学习模型构建古汉语植物命名实体识别模型,比较分析各模型性能以确定最优模型;设计了面向知识图谱的古汉语植物知识组织模式。 结果/结论 基于领域预训练语言模型SikuRoBERTa构建的古汉语植物命名实体识别模型性能最优,调和平均值达85.44%,为基于实体的植物知识挖掘提供了有效方法;构建了先秦典籍植物知识图谱,实现了对先秦典籍中植物实体及其关联知识的聚合与可视化呈现。