Current Location:home > Detailed Browse

Article Detail

基于维基百科的中文文本层次路径生成研究

Abstracts

【目的】利用维基百科知识库生成自由文本的层次语义路径。【方法】针对维基百科的中文导出数据, 构建层次结构的树状图; 进而通过显性语义分析将自由文本表示为文章概念向量, 通过文章–类别关联关系将文本映射到树状图中构成种子类别节点, 再通过种子节点开始的信息扩散和自顶向下的路径选择与优化, 生成层次路径。【结果】首条层次路径的平均相关度在测试集上达到54.10%, 前20 条路径整体上按相关度降序排序。【局限】未分析显性概念向量在保留不同概念数量时对生成路径质量的影响。【结论】基于维基百科知识库所生成的层次路径结果能够反映文本的主要语义信息。
Download Comment From cooperative journals:《数据分析与知识发现》 Hits:1050 Downloads:739
Recommended references: 夏天.(2017).基于维基百科的中文文本层次路径生成研究.数据分析与知识发现.[ChinaXiv:201711.01237] (Click&Copy)
Version History
[V1] 2017-10-11 13:20:06 chinaXiv:201711.01237V1 Download
Related Paper

Download

Current Browse

Change Subject Browse

Cross Subject Browse

  • - NO