分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-12-05 合作期刊: 《数据分析与知识发现》
摘要: 【目的】构建一种更加科学、准确的评论文本情感倾向性分析方法, 解决网络新词难于计算的问题。【方 法】利用概念层次网络(HNC)理论的符号对偶性计算情感值, 根据建立的规则为新词确定符号, 利用符号重用降 低工作量, 实现对新词的处理。【结果】通过对已有成果的分析和改进, 最终得到一套较为完善的情感倾向性分 析方法, 并使用真实数据进行实验, 验证了该方法的可行性, 同时也发现了待改进之处。【局限】目前仅能对网 络短文本进行分析, 且新词的加入需采用人工标注的方式。【结论】本文方法可行有效, 为文本情感分析提供了 新思路。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-12-05 合作期刊: 《数据分析与知识发现》
摘要: 【目的】通过对电子商务评论文本的分析和处理, 获取有效的商家信誉信息, 从客观角度建立商家信誉维 度体系。【方法】基于 HNC 理论的同行优先原理和文本挖掘方法提出改进的评论文本主题词抽取方法和主题词 聚类算法, 并进行类簇标签抽取及各类簇权重计算。【结果】生成商家信誉维度体系及各维度权重, 以京东平台 手机评论文本为实例, 构建商家信誉维度体系, 并对其进行评价, 证明方法的可行性与有效性。【局限】受 HNC 词库不全的影响需手工生成一部分字词符号, 在应用到更大规模的评论文本处理时可能会存在限制。【结论】利 用本文提出的方法建立的商家信誉维度体系能够客观地反映出用户真正关心的商品指标。