Current Location:home > Detailed Browse

Article Detail

基于WMD语义相似度的TextRank改进算法识别论文核心主题句研究

Abstracts

【目的】自动甄别科技论文中描述研究主题的关键语句。【方法】以论文小节为单位组织句子集, 通过训练领域词向量计算句子间WMD 距离得到相应语义相似度, 优化TextRank 算法迭代过程, 利用外部特征对所得权值进行调整, 按句子权值降序选取关键主题句。【结果】以气候变化领域科技论文作为实验数据, 以人工标注的结果为基准对本文的算法和传统的TextRank 算法进行对比实验, 初步结果表明该方法的识别效果(F值)比传统TextRank 算法提升约5%。【局限】句子特征提取有待提高, 词向量训练及方法中的相关参数需要做进一步优化。【结论】基于领域词向量, 融合WMD 语义相似度的TextRank 改进算法, 能够较好地甄别科技论文小节内部中心句, 辅以外部特征的权值调整后可以较好地识别出一篇论文的核心主题句。
Download Comment From cooperative journals:《数据分析与知识发现》 Hits:2392 Downloads:1859
Recommended references: 王子璇,乐小虬,何远标.(2017).基于WMD语义相似度的TextRank改进算法识别论文核心主题句研究.数据分析与知识发现.[ChinaXiv:201711.01946] (Click&Copy)
Version History
[V1] 2017-11-08 16:30:53 chinaXiv:201711.01946V1 Download
Related Paper

Download

Current Browse

Change Subject Browse

Cross Subject Browse

  • - NO