Current Location:home > Browse

1. chinaXiv:201711.01251 [pdf]

中文评论产品特征与观点抽取方法研究

孟园; 王洪伟
Subjects: Library Science,Information Science >> Information Science

【目的】针对中文在线评论产品特征与观点抽取问题, 提出一种基于置信度排序模型的抽取方法。【方法】在改进HITS 算法基础上, 综合考虑候选特征观点词的关联关系和语义关系构建置信度排序模型, 提取并过滤特征观点词。【结果】和基准模型相比, 本文方法对中文语料的产品特征和观点抽取能达到较高准确率和召回率。【局限】仅针对产品显性特征抽取, 没有考虑隐性特征的识别与抽取。【结论】利用特征词和观点词的双向增强关系和语义关系, 可以有效抽取产品特征观点; 情感极性过滤对提升观点词抽取准确率有较大作用。

submitted time 2017-10-11 From cooperative journals:《数据分析与知识发现》 Hits316Downloads211 Comment 0

2. chinaXiv:201711.01223 [pdf]

基于文本内容特征选择的评论质量检测

孟园; 王洪伟
Subjects: Library Science,Information Science >> Information Science

【目的】在有效提取多维特征基础上, 考察评论内容特征对评论质量检测的影响。【方法】基于评论文本的信息特征度量和情感倾向的混合性, 量化并抽取评论内容特征, 采用GBDT 模型评估特征集合分类效果, 结合贪婪式特征选择算法识别有效内容特征, 分析其对评论质量检测的影响。【结果】将评论内容特征应用于评论质量检测任务中能取得较好的效果, 明显提升了实验准确率和召回率。【局限】实验对象主要是搜索型产品的评论数据, 未对其他享受型产品(如电影、音乐)等进行验证和比较。【结论】评论内容的信息增益、产品特征词的信息增益、评论客观情感倾向度、内容差异性对评论质量检测有明显作用。

submitted time 2017-10-11 From cooperative journals:《数据分析与知识发现》 Hits220Downloads150 Comment 0

  [1 Pages/ 2 Totals]