分类: 图书馆学、情报学 >> 情报学 提交时间: 2022-09-02
摘要: 目的/意义 当前用户迫切需要在极度复杂的信息当中高效获取具有价值的信息,在这种背景下,本文提出一种多特征融合的自动标引方法以提高文本标引的准确性。 方法/过程 首先将文本正文和摘要同时作为标引源,接着分别采用Keybert方法和TF-IDF方法处理摘要和正文,同时结合统计学习法的词频特征和机器学习法的语义特征获取两组文本候选标引词;最后通过语义相似度计算做融合处理结合两种方法的优势以体现对标引结果的准确性和全面性的整体把握。 结果/结论 实验表明,基于多特征融合的文本自动标引是可行的,具有较好的标引结果。