您当前的位置:首页 > 论文浏览

1. chinaXiv:201812.00103 [pdf]

基于CRT机制混合神经网络的特定目标情感分析

孟威; 尉永清; 刘文锋
分类: 计算机科学 >> 计算机科学的集成理论

特定目标情感分析的目的是从不同目标词语的角度来预测文本的情感,关键是为给定的目标分配适当的情感词。当句子中出现多个情感词描述多个目标情感的情况时,可能会导致情感词和目标之间的不匹配。由此提出了一个CRT机制混合神经网络来用于特定目标情感分析,模型使用CNN层从经过BiLSTM变换后的单词表示中提取特征,通过CRT组件生成单词的特定目标表示并保存来自BiLSTM层的原始上下文信息。在三种公开数据集上进行了实验,实验结果表明,该模型在特定目标情感分析任务中较之前的情感分析模型在准确率和稳定性上有着明显的提升,证明CRT机制能很好地整合CNN和LSTM的优势,这对于特定目标情感分析任务具有重要的意义。

提交时间: 2018-12-13 来自合作期刊:《计算机应用研究》 点击量29下载量15 评论 0

2. chinaXiv:201812.00116 [pdf]

基于卷积神经网络和贝叶斯分类器的句子分类模型

李文宽; 刘培玉; 朱振方; 刘文锋
分类: 计算机科学 >> 计算机科学的集成理论

传统句子分类模型存在特征提取过程复杂且分类准确率较低等不足,利用当下流行的基于深度学习模型的卷积神经网络在特征提取上的优势,结合传统句子分类方法提出一种基于卷积神经网络和贝叶斯分类器的句子分类模型。该模型首先利用卷积神经网络提取文本特征,其次利用主成分分析法对文本特征进行降维,最后利用贝叶斯分类器进行句子分类。实验结果表明在康奈尔大学公开的影评数据集和斯坦福大学情感分类数据集上,所提出的方法优于只使用深度学习的模型或传统句子分类模型。

提交时间: 2018-12-13 来自合作期刊:《计算机应用研究》 点击量36下载量21 评论 0

3. chinaXiv:201804.02053 [pdf]

基于TextRank的自动摘要优化算法

李娜娜; 刘培玉; 刘文锋; 刘伟童
分类: 计算机科学 >> 计算机科学的集成理论

在对中文文本进行摘要提取时,传统的TextRank算法只考虑节点间的相似性,忽略了文本的其他重要信息。首先,针对中文单文档,在现有研究的基础上,使用TextRank算法,一方面考虑句子间的相似性,另一方面,使TextRank算法与文本的整体结构信息、句子的上下文信息等相结合,如文档句子或者段落的物理位置、特征句子、核心句子等有可能提升权重的句子,来生成文本的摘要候选句群;然后对得到的摘要候选句群做冗余处理,以除去候选句群中相似度较高的句子,得到最终的文本摘要。最后通过实验验证,该算法能够提高生成摘要的准确性,表明了该算法的有效性。

提交时间: 2018-04-19 来自合作期刊:《计算机应用研究》 点击量253下载量163 评论 0

4. chinaXiv:201804.02058 [pdf]

基于互信息和邻接熵的新词发现算法

刘伟童; 刘培玉; 刘文锋; 李娜娜
分类: 计算机科学 >> 计算机科学的集成理论

如何快速高效地识别新词是自然语言处理中一项非常重要的任务,针对当前新词发现存在的问题,提出了一种从左至右逐字在未切词的微博语料中发现新词的算法。通过计算候选词语与其右邻接字的互信息来逐字扩展,得到候选新词;并通过计算邻接熵、删除候选新词的首尾停用词和过滤旧词语等方法来过滤候选新词,最终得到新词集。解决了因切词错误导致部分新词无法识别以及通过n-gram方法导致大量重复词串和垃圾词串识别为新词的问题,最后通过实验验证了该算法的有效性。

提交时间: 2018-04-19 来自合作期刊:《计算机应用研究》 点击量260下载量183 评论 0

  [1 页/ 4 条记录]