您选择的条件: 杨海霞
  • 评论文本对酒店满意度的影响: 基于情感分析的方法

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】通过对评论文本进行文本分析, 研究影响酒店用户满意度的因素, 为酒店管理者提供建议。【方法】利用Word2Vec 对Tripadvisor.com酒店评论进行特征抽取和降维, 结合情感分析技术, 提取每类特征对应的情感,构建计量经济模型分析酒店特征评价与用户满意度的关系。【结果】研究结果表明: (1)评论文本的情感表达越积极满意度越高, 但这种影响并非线性的, 而是呈现“U”形的; (2)用户评论文本中提到的特征类别数越多, 该用户越有可能倾向不满意; (3)消费者对豪华型酒店和经济型酒店特征类别的关注存在显著差异, 消费者对前者更关注员工服务, 对后者更注重清洁度; (4)对豪华型酒店, 消费者满意度受到网络(Internet)这个特征维度的显著影响, 而对于经济型酒店该维度的影响则不显著。【局限】样本的选择不够全面, 未来可爬取多个城市数据进行更全面分析。【结论】从评论文本角度建立了酒店特征与消费者满意度的联系, 为酒店在线口碑研究提供了理论依据。

  • 基于LDA 挖掘计算机科学文献的研究主题

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】运用文本挖掘技术自动从海量科技文献中提取研究主题并探测其研究趋势。【方法】以《中文核心期刊要目总览(2014 年版))—“TP 自动化技术、计算机技术”栏目前10 种期刊刊载的计算机科学类(Computer Science)文献为研究对象, 借助LDA 主题模型, 考虑科技文献的发表时间信息, 挖掘出典型话题, 并根据主题强度分析主题的演化趋势。【结果】18 个研究话题中有7 个主题强度上升的主题和6 个主题强度下降的主题。【局限】仅分析了国内计算机领域的前10 种期刊, 期刊范围不够大, 也未考虑国外计算机领域的期刊文献。【结论】该方法能够深入挖掘计算机领域期刊文献的话题, 帮助从事该领域研究的学者了解主题的演化趋势并寻找新兴研究主题。

  • 基于STM 分析旅行者对不同档次酒店的偏好差异

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】探测 Web2.0 时代下,不同类型旅行者对不同档次酒店提供的产品或服务的偏好差异。【方法】将 酒店划分为豪华型酒店和经济型酒店, 将旅行者划分为 5 种旅行类型, 分析不同旅行者对豪华型酒店和经济型 酒店的评分模式, 并借助结构主题模型(Structure Topic Model, STM)对酒店在线评论文本进行细致分析,挖掘在线评论话题,分析各个旅行类型的旅行者对不同档次酒店提供的服务偏好差异。【结果】实验结果表明:5种旅行类型下,旅行者对豪华型酒店的平均评分均高于对经济型酒店的平均评分;各类旅行者,对不同档次酒店所提 供的产品或服务存在偏好差异。【局限】实验数据不够充分;忽略了诸如性别、年龄等因素对在线评论的数值评分和文本内容的影响。【结论】分析不同类型旅行者对不同档次酒店的偏好差异,有助于酒店管理者制定服务供 应策略, 有助于消费者制定购买决策。