分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-12-05 合作期刊: 《数据分析与知识发现》
摘要: 【目的】对微博进行细粒度情感分析, 将情感分为 8 类, 并计算其情感强度值, 从而尽可能还原微博用户 情感。【方法】通过微博语料分析构建疑问词词表, 在大连理工大学情感词汇本体 DUTIR 的 7 类情感基础上, 丰 富一类情感“疑”, 并利用点互信息法构建表情符号词典, 还综合考虑否定词和程度副词对情感表达的影响, 利用 Python 从新浪微博上获取数据, 并用 R 语言的 jiebaR 包进行分词, 对情感进行分类并计算其强度。【结果】得到 微博用户对于糖尿病 7 类常用药物的 8 类情感占比及情感强度, 并通过正确率、召回率、F 值对结果进行验证, 其 中“怒”和“哀”的正确率最高, 分别为 85.73%和 83.05%, 而“乐”和“好”的召回率与 F 值均最高, 为 81%以上。本文 新增情感“疑”的正确率、召回率、F 值分别为 77.33%、78.58%、77.95%, 均值在 8 类情感中排名前列, 说明其情 感识别较好。【局限】由于本文依赖于情感词典进行情感分析, 因此为了更好的分析结果, 情感词典仍需进一步 完善。【结论】本方法具有较高的识别率和可靠性, 能够更好地对微博上的情感分类进行细粒度分析。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-30 合作期刊: 《数据分析与知识发现》
摘要: 【目的】对微博进行细粒度情感分析, 将情感分为 8 类, 并计算其情感强度值, 从而尽可能还原微博用户 情感。【方法】通过微博语料分析构建疑问词词表, 在大连理工大学情感词汇本体 DUTIR 的 7 类情感基础上, 丰 富一类情感“疑”, 并利用点互信息法构建表情符号词典, 还综合考虑否定词和程度副词对情感表达的影响, 利用 Python 从新浪微博上获取数据, 并用 R 语言的 jiebaR 包进行分词, 对情感进行分类并计算其强度。【结果】得到 微博用户对于糖尿病 7 类常用药物的 8 类情感占比及情感强度, 并通过正确率、召回率、F 值对结果进行验证, 其 中“怒”和“哀”的正确率最高, 分别为 85.73%和 83.05%, 而“乐”和“好”的召回率与 F 值均最高, 为 81%以上。本文 新增情感“疑”的正确率、召回率、F 值分别为 77.33%、78.58%、77.95%, 均值在 8 类情感中排名前列, 说明其情 感识别较好。【局限】由于本文依赖于情感词典进行情感分析, 因此为了更好的分析结果, 情感词典仍需进一步 完善。【结论】本方法具有较高的识别率和可靠性, 能够更好地对微博上的情感分类进行细粒度分析。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》
摘要: 【目的】对比较观点挖掘和相关研究的主流研究方法和步骤进行综述, 为相关领域的未来研究提供指导。【文献范围】从WoS, Google Scholar, CNKI 中以“比较观点(Comparative Opinion)”、“比较句识别(Comparative Sentence)”、“比较关系(Comparative Relation)”等为检索词筛选获得55 篇相关文献。【方法】基于文献调研, 介绍比较范畴的划分、比较句识别、比较关系抽取和比较观点情感分析等研究进展。【结果】由于有限的序列规则, 比较观点的识别难以进一步提高, 对隐形比较观点的识别研究鲜有提及, 并且现有的抽取技术难以很好地提取比较要素。此外, 比较观点缺乏细粒度的情感分析。【局限】缺乏对现有比较观点识别方法的对比分析。【结论】本文提出的研究框架可以为未来进一步研究提供参考。此外, 未来的工作重点应关注通过比较观点识别追踪潜在竞争对手, 分析产品竞争力, 以及提供不同商品的对比分析等。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-27 合作期刊: 《图书情报工作》
摘要: [目的/意义]微博已成为大众情感表达的重要平台,微博的情感分析在舆情分析、用户体验、商机挖掘等方面有着重要的作用。[方法/过程]提出的情感倾向分类算法WE_SDAE使用单词嵌入的方式将微博表示成一个低维稠密向量,然后通过添加正则项和加噪处理的方式将基本的自动编码器算法优化成深层噪音自动编码器,并在顶层添加分类器,实现情感倾向分类。考虑到微博用词灵活,还从单字和词语两个粒度训练模型。[结果/结论]实验结果表明,基于单字粒度的模型表现优于基于词语粒度的模型。此外,对比实验显示WE_SDAE算法优于传统的SVM、Naive-Bayes、XgBoost等相关算法;单词嵌入的方式优于传统的向量空间模型表示方法,能在微博情感分析中取得较好的效果。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》
摘要: [目的/意义] 构建一种基于Word2Vec和CNN的产品评论细粒度情感分析模型。[方法/过程] 首先使用Word2Vec从产品评论中构建产品特征词列表和噪声词表,其次借助噪声词表来进行产品评论特征词的提取,然后采用CNN对产品评论进行产品特征层面的细粒度情感分类,最后实现基于产品特征的产品评论聚类。[结果/结论] 通过爬取京东商城华为手机评论对该模型进行训练和测试,结果表明,该模型能够有效实现产品评论的细粒度情感分析,可以有效地发现用户对产品特征的关注度和满意度。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-10-08 合作期刊: 《知识管理论坛》
摘要: [ 目的 / 意义 ] 旨在探索政务微博网民参与程度的影响因素,为政务微博运营提供参考建议。 [ 方法 / 过程 ] 基于某政务微博账号 2015 年 11 月至 2017 年 10 月的微博数据,分析标签使用与网民参 与度之间关系,研究微博文本内容的情感性对网民参与度的影响。[ 结果 / 结论 ] 政务微博标签具有本 地化特点,标签的使用会提高网民参与度;微博文本内容的情感性影响网民参与度,情感积极的微博比 情感消极的微博带来更高的网民参与度。本研究结果对于提升政务微博的网民参与水平具有借鉴意义。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-05-24 合作期刊: 《计算机应用研究》
摘要: 为了对中文微博进行有效的情感极性识别,基于表情符能改变或加强微博文本的情感极性这一认知事实,提出基于表情符注意力机制的微博情感分析神经网络模型。该模型在使用双向循环神经网络模型(Bi-LSTM)学习文本的特征表示时,利用表情符注意力机制,得到文本结合表情符后新的特征表示,从而实现微博情感识别。实验结果显示,与输入纯文本和表情符的Bi-LSTM模型相比,基于表情符注意力机制的模型准确率提高了4.06%;与仅输入纯文本的Bi-LSTM模型相比,基于表情符注意力机制的模型准确率提高了6.35%。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-07-26 合作期刊: 《图书情报工作》
摘要: [目的/意义] 一带一路倡议的提出引起了国内外广泛的关注,众多国家的用户在最具代表性的社交媒体Twitter中表达观点、发表评论、相互讨论。从推文中挖掘得出世界对一带一路的讨论主题和情感倾向,有助于为政府机构优化宣传策略,增加一带一路倡议的曝光度、关注度提供参考。[方法/过程] 采集2017年与一带一路相关的6万余条推文,分别按照中文和英文进行数据预处理、数据描述、主题挖掘、情感分析,并实现主题和情感的交叉分析,得出结论。[结果/结论] 2017年的推文主题主要围绕5月份的一带一路高峰论坛。其中,中文推文更关注高峰论坛的筹划和实施,以及安全问题、领导层的访问等方面的内容,情感值的波动较大,特别是安全问题上的消极情绪波动很大。英文推文则更关注举办高峰论坛的事实以及论坛所带来的经济效应,情感波动较小,经济方面的情感值是积极占比明显高于消极和中立的情感值。
分类: 心理学 >> 应用心理学 提交时间: 2022-03-06
摘要: [目的] 本研究基于天涯社区用户,探究子女处于不同学段的父母在生活满意度及情感表达上所存在的差异。[方法] 利用大连理工情感词典计算出子女处于学前、小学、初中教育学段的父母在21类情感上的词频分布,并以此为特征对不同学段父母的生活满意度进行预测,比较子女处于不同学段的父母在词频分布和生活满意度上的差异。 [结果] 在生活满意度上,子女处于初中学段的父母的生活满意度显著的低于处于学前和小学的父母的生活满意度。在快乐情感类上,学前父母的词频高于小学和初中父母;在安心情感类和赞扬情感类上,初中父母的词频高于学前父母;在相信情感类上,初中父母的词频高于学前和小学的父母;在喜爱情感类上,学前父母的词频要高于小学和初中的父母,小学父母的词频高于初中父母;在思情感词上,初中父母的词频高于小学父母;在慌情感类上,初中父母词频高于学前父母和小学父母。[局限] 本研究采用爬虫技术在天涯论坛中收集到的样本量较为有限,部分主题贴中可能存在父母长期记录生活期间其子女的学段发生跨越的情况,未来研究可从更多学段、父母角色、纵向视角着手进一步探索影响不同学段父母生活满意度的可能因素。[结论] 在生活满意度上,相比于学前和小学阶段子女的父母,子女处于初中阶段的父母其生活满意度最低;在情感表达上,在快乐、安心、赞扬、相信、喜爱、思、慌这几类情感词中,子女处于不同学段的父母之间存在差异。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-05-20 合作期刊: 《计算机应用研究》
摘要: 网购评语是消费者对网购商品的直接反馈,从中挖掘有价值的知识有助于为商家开展精准化营销和个性化推荐服务、消费者制定购买决策等提供依据。鉴于此,以国内大型综合型电商平台上服装类网购评语为研究对象,对评语分词、筛选高频词,分析高频词之间的共现关系,构建高频词共现网络,分析得出网络评语的热点词多个结构特征和评语网络中少数节点对网络的运行起着主导的作用,为网购评语挖掘研究领域提供了按照网购评语高频词共现网络的结构特性对销量的交互影响进行研究的思路。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-12-05 合作期刊: 《数据分析与知识发现》
摘要: 【目的】构建一种更加科学、准确的评论文本情感倾向性分析方法, 解决网络新词难于计算的问题。【方 法】利用概念层次网络(HNC)理论的符号对偶性计算情感值, 根据建立的规则为新词确定符号, 利用符号重用降 低工作量, 实现对新词的处理。【结果】通过对已有成果的分析和改进, 最终得到一套较为完善的情感倾向性分 析方法, 并使用真实数据进行实验, 验证了该方法的可行性, 同时也发现了待改进之处。【局限】目前仅能对网 络短文本进行分析, 且新词的加入需采用人工标注的方式。【结论】本文方法可行有效, 为文本情感分析提供了 新思路。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-07-26 合作期刊: 《图书情报工作》
摘要: [目的/意义]探索热点事件评论网络中话题社群及网民的情感波动,掌握舆情事件发展过程,对于整体把握热点事件的发展方向,做好新时期网络舆论的引导工作具有重大意义。[方法/过程]以复杂网络理论为基础,基于评论词语间的共现关系构建基于事件发展的子事件网络,通过社群发现算法来识别子事件评论网络中的话题社群,将情感词依据情感词典赋予情感分类属性,基于事件的演化过程动态地跟踪网民意见以及情感波动。[结果/结论]研究结果表明,评论网络群落发现以及变异系数方法可以有效地衡量网民话题讨论的规模与集中程度;评论网络中赋予情感词节点情感分类属性方法可以体现事件演化过程中网民的情感变化;舆论衍生话题对事件的舆情发展有持续性影响;网民话题讨论内容对于事件演化具有一定程度上的前瞻性。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》
摘要: [目的/意义] 人工智能、大数据等领域的快速发展使得商业发展与隐私保护之间的矛盾愈发尖锐。通过对不同类型的网络隐私争议事件微博评论进行情感及话题对比分析,以探究不同情境下网络用户的隐私态度的异同点与背后机理。[方法/过程] 采集2012年至2019年网络隐私争议事件的相关微博评论,对其进行预处理,作为实验数据;基于情感词典计算各评论的情感强度值,并将隐私争议事件分为隐私收集类、隐私曝光类及隐私协议类,对比分析不同情境下的用户评论情感趋势;构建用户隐私讨论对象-情感表达二分网络,并通过二分网络投影构建单顶点网络,结合节点中心性等指标进行二分网络及投影分析。[结果/结论] 结果表明,用户整体隐私关注呈现上升趋势;不同类型隐私争议事件的用户负面情感强度水平不同;不同隐私争议情境下用户的关注热点差异较大,情感表达各有特点。以上结果表明不同情境中的用户隐私关注及情感表现具有明显差异。
分类: 计算机科学 >> 自然语言理解与机器翻译 提交时间: 2022-05-13
摘要: 探讨如何对股吧等金融论坛数据进行爬取并结合深度学习模型进行情感分析。本文将使用BERT模型针对金融语料进行训练,并对深证成指进行对比分析。通过最大互信息系数对比验证,发现将BERT模型应用到金融语料中所得到的情感特征能够证明情绪变量在一定程度上与股票价格存在一定相关性。同时本文是深度学习在金融环境下的运用。在通过深度学习的方法进一步探究投资者情绪对股票市场的影响机制,将有利于国家监管部门和政策部门对维持股票市场稳定性制定更加合理的政策方针。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-12-05 合作期刊: 《数据分析与知识发现》
摘要: 【目的】提出一种基于情感分析技术自动识别特定领域谣言的方法。【方法】界定高、低质量信息源, 在 假设高质量信息源信息更可靠的情况下, 通过基于情感词典的情感分析方法, 量化高质量信息源与低质量信息 源对特定对象的情感差异, 判定低质量信息源提供的信息是否属于谣言。【结果】将该方法应用于“食品养生”、 “医学健康”两个领域进行谣言识别。在 30 个疑似谣言案例中准确识别出 23 个谣言案例, 准确率为 76.67%。 本文提出的谣言识别方法在谣言预测方面的 F 值为 83.34%, 查全率为 71.42%, 查准率为 100%; 在非谣言文本预测 上的 F 值为 72.73%, 查全率为 100%, 查准率为 57.14%。【局限】未实现不同信息源数据自动抽取, 每个谣言案例 下的人工收集的谣言数量有限。【结论】本文基于情感分析的谣言识别方法对特定类型的谣言是有效的。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-30 合作期刊: 《数据分析与知识发现》
摘要: 【目的】提出一种基于情感分析技术自动识别特定领域谣言的方法。【方法】界定高、低质量信息源, 在 假设高质量信息源信息更可靠的情况下, 通过基于情感词典的情感分析方法, 量化高质量信息源与低质量信息 源对特定对象的情感差异, 判定低质量信息源提供的信息是否属于谣言。【结果】将该方法应用于“食品养生”、 “医学健康”两个领域进行谣言识别。在 30 个疑似谣言案例中准确识别出 23 个谣言案例, 准确率为 76.67%。 本文提出的谣言识别方法在谣言预测方面的 F 值为 83.34%, 查全率为 71.42%, 查准率为 100%; 在非谣言文本预测 上的 F 值为 72.73%, 查全率为 100%, 查准率为 57.14%。【局限】未实现不同信息源数据自动抽取, 每个谣言案例 下的人工收集的谣言数量有限。【结论】本文基于情感分析的谣言识别方法对特定类型的谣言是有效的。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》
摘要: 【目的】通过对网络游记进行情感分析, 发现游客对旅游地情感倾向的时间分布规律。【应用背景】越来越多人通过浏览大量网络游记来收集信息, 制定旅游计划。网络游记成为旅游者搭配旅游地及出游时间的重要参考内容, 也为商家提供了商机。【方法】提出面向网络游记时间特征的情感分析模型, 分析游客情感的时间变化规律。该模型包括5 个模块: 网络游记文本内容及旅游时间数据的采集、游记文本预处理、情感标注、按时间段统计游记情感特征分值、游记情感时间特征分析。并从网络抓取4 种类型旅游地游记对模型进行实验。【结果】在7类情感中, [好]的情感均值在各旅游地的各月份中总是远高于其他情感, 较为稳定; [好]、[乐]和[恶]在不同月份的波动程度较大; 情感随时间的波动与相应游记数量并不相关, 即传统的旅游地旺季和淡季的划分与游客的实际情感体验并不相关。【结论】该模型能够有效地反映旅游地的游客情感随时间变化的波动, 进而为旅游管理者、潜在旅游者信息获取提供新的信息参考渠道。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》
摘要: 【目的】通过对网络游记进行情感分析, 发现游客对旅游地情感倾向的时间分布规律。【应用背景】越来越多人通过浏览大量网络游记来收集信息, 制定旅游计划。网络游记成为旅游者搭配旅游地及出游时间的重要参考内容, 也为商家提供了商机。【方法】提出面向网络游记时间特征的情感分析模型, 分析游客情感的时间变化规律。该模型包括5 个模块: 网络游记文本内容及旅游时间数据的采集、游记文本预处理、情感标注、按时间段统计游记情感特征分值、游记情感时间特征分析。并从网络抓取4 种类型旅游地游记对模型进行实验。【结果】在7类情感中, [好]的情感均值在各旅游地的各月份中总是远高于其他情感, 较为稳定; [好]、[乐]和[恶]在不同月份的波动程度较大; 情感随时间的波动与相应游记数量并不相关, 即传统的旅游地旺季和淡季的划分与游客的实际情感体验并不相关。【结论】该模型能够有效地反映旅游地的游客情感随时间变化的波动, 进而为旅游管理者、潜在旅游者信息获取提供新的信息参考渠道。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-27 合作期刊: 《图书情报工作》
摘要: [目的/意义]针对自动识别论文引用情感问题,提出一种基于引文内容分析的识别方法并进行可视化展示,克服基于简单引用频次计量无法区分不同引用情感的问题。[方法/过程]首先,利用正则表达式抽取出论文全文中的引文内容信息;然后,利用TF-IDF算法筛选出引用情感特征词,结合情感词典,利用情感分析技术对引文内容进行引用情感识别;最后,利用可视化工具展示出引用情感整体分布情况。[结果/结论]该方法能够有效识别出抗衰老领域论文数据集中引用情感情况。实验结果显示,该领域正面引用占总引用次数的21%,中立引用占总引用次数的78%,负面引用仅占总引用次数的1%。与传统引文网络相比较,基于引用情感的可视化图谱可以有效识别出不同引用情感在整体数据集合上的分布情况。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-26 合作期刊: 《图书情报工作》
摘要: [目的/意义]微博加V用户由于自身特性更容易成为网络中的意见领袖,然而目前研究焦点往往是大V用户,忽略了中V用户。以新浪微博的中V用户作为研究对象,对中V用户的传播特征和舆情引导力进行分析,进而提供针对中V用户的管理建议。[方法/过程]以罗一笑事件为例,从事件演进和用户类型两个维度对中V用户传播特征进行分析;同时结合情感计算模型、意见领袖指标评价法构建出用户属性矩阵,对中V用户舆情引导力进行研究。[结果/结论]通过对中V用户的研究发现,中V用户具有舆情引导力较强、专业性较强、商业色彩弱、粉丝同质性高等显著特征,并提出相关管理建议。