分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-08-13 合作期刊: 《计算机应用研究》
摘要: 针对传统实体对齐的方法无法体现潜在语义信息的问题,对其进行优化,使实体对齐效果更加显著。使用LDA模型对网络百科非结构化数据进行建模,采用改进的BP算法求解LDA模型中的隐藏参数,进而生成实体特征向量进行相似度计算,通过计算结果判断是否可以对齐。实验结果表明,通过与三种传统的算法进行比较,所提算法在准确率、召回率和综合指标F值三个评价指标均有所提高。针对具有描述信息的网络百科实体,该算法可以有效提升实体对齐效果。