您当前的位置: > 详细浏览

基于维基百科的中文文本层次路径生成研究 后印本

请选择邀稿期刊:
摘要: 【目的】利用维基百科知识库生成自由文本的层次语义路径。【方法】针对维基百科的中文导出数据, 构建层次结构的树状图; 进而通过显性语义分析将自由文本表示为文章概念向量, 通过文章–类别关联关系将文本映射到树状图中构成种子类别节点, 再通过种子节点开始的信息扩散和自顶向下的路径选择与优化, 生成层次路径。【结果】首条层次路径的平均相关度在测试集上达到54.10%, 前20 条路径整体上按相关度降序排序。【局限】未分析显性概念向量在保留不同概念数量时对生成路径质量的影响。【结论】基于维基百科知识库所生成的层次路径结果能够反映文本的主要语义信息。

版本历史

[V1] 2017-10-11 13:20:06 ChinaXiv:201711.01237V1 下载全文
点击下载全文
预览
许可声明
metrics指标
  •  点击量2032
  •  下载量1263
评论
分享