ChinaXiv.org 中国科学院科技论文预发布平台

按提交时间

2018
3

按主题分类

计算机科学的集成理论
3

按作者

按机构

当前资源共 3条

隐藏摘要

点击量

时间

下载量

您选择的条件: 刘培玉

1. ChinaXiv:201812.00116
下载全文

基于卷积神经网络和贝叶斯分类器的句子分类模型

分类：计算机科学 >> 计算机科学的集成理论提交时间： 2018-12-13 合作期刊: 《计算机应用研究》

李文宽刘培玉朱振方刘文锋

摘要：传统句子分类模型存在特征提取过程复杂且分类准确率较低等不足，利用当下流行的基于深度学习模型的卷积神经网络在特征提取上的优势，结合传统句子分类方法提出一种基于卷积神经网络和贝叶斯分类器的句子分类模型。该模型首先利用卷积神经网络提取文本特征，其次利用主成分分析法对文本特征进行降维，最后利用贝叶斯分类器进行句子分类。实验结果表明在康奈尔大学公开的影评数据集和斯坦福大学情感分类数据集上，所提出的方法优于只使用深度学习的模型或传统句子分类模型。

点击量 2257 下载量 1230 评论 0
2. ChinaXiv:201804.02053
下载全文

基于TextRank的自动摘要优化算法

分类：计算机科学 >> 计算机科学的集成理论提交时间： 2018-04-19 合作期刊: 《计算机应用研究》

李娜娜刘培玉刘文锋刘伟童

摘要：在对中文文本进行摘要提取时，传统的TextRank算法只考虑节点间的相似性，忽略了文本的其他重要信息。首先，针对中文单文档，在现有研究的基础上，使用TextRank算法，一方面考虑句子间的相似性，另一方面，使TextRank算法与文本的整体结构信息、句子的上下文信息等相结合，如文档句子或者段落的物理位置、特征句子、核心句子等有可能提升权重的句子，来生成文本的摘要候选句群；然后对得到的摘要候选句群做冗余处理，以除去候选句群中相似度较高的句子，得到最终的文本摘要。最后通过实验验证，该算法能够提高生成摘要的准确性，表明了该算法的有效性。

点击量 3195 下载量 2014 评论 0
3. ChinaXiv:201804.02058
下载全文

基于互信息和邻接熵的新词发现算法

分类：计算机科学 >> 计算机科学的集成理论提交时间： 2018-04-19 合作期刊: 《计算机应用研究》

刘伟童刘培玉刘文锋李娜娜

摘要：如何快速高效地识别新词是自然语言处理中一项非常重要的任务，针对当前新词发现存在的问题，提出了一种从左至右逐字在未切词的微博语料中发现新词的算法。通过计算候选词语与其右邻接字的互信息来逐字扩展，得到候选新词；并通过计算邻接熵、删除候选新词的首尾停用词和过滤旧词语等方法来过滤候选新词，最终得到新词集。解决了因切词错误导致部分新词无法识别以及通过n-gram方法导致大量重复词串和垃圾词串识别为新词的问题，最后通过实验验证了该算法的有效性。

点击量 2870 下载量 1638 评论 0

基于卷积神经网络和贝叶斯分类器的句子分类模型

基于TextRank的自动摘要优化算法

基于互信息和邻接熵的新词发现算法