【目的】针对中文在线评论产品特征与观点抽取问题, 提出一种基于置信度排序模型的抽取方法。【方法】在改进HITS 算法基础上, 综合考虑候选特征观点词的关联关系和语义关系构建置信度排序模型, 提取并过滤特征观点词。【结果】和基准模型相比, 本文方法对中文语料的产品特征和观点抽取能达到较高准确率和召回率。【局限】仅针对产品显性特征抽取, 没有考虑隐性特征的识别与抽取。【结论】利用特征词和观点词的双向增强关系和语义关系, 可以有效抽取产品特征观点; 情感极性过滤对提升观点词抽取准确率有较大作用。 |
Version History | ||||
---|---|---|---|---|
[V1] | 2017-10-11 13:20:06 | chinaXiv:201711.01251V1 | Download |
Related Paper |
---|