ChinaXiv.org 中国科学院科技论文预发布平台

注册登录

EN | 中文

按提交时间

2018
1

按主题分类

自然语言理解与机器翻译
1

按作者

按机构

当前资源共 1条

隐藏摘要

点击量

时间

您选择的条件: 北京邮电大学北京100876

1. ChinaXiv:201809.00191
下载全文

基于代价敏感集成极限学习机的文本分类方法

分类：计算机科学 >> 自然语言理解与机器翻译提交时间： 2018-09-27

李明肖培伦张矩顾心盟

摘要：加权极限学习机对不同类别的样本赋予不同的权值，在一定程度上提高了分类准确率,但加权极限学习机只考虑了不同类别样本之间差异，忽视了样本噪声和同类样本之间的差异。本文提出了一种基于文本类别信息熵的极限学习机集成方法，该方法以Adaboost.M1 为算法框架，通过文本的类内分布熵和类间分布熵生成文本类别信息熵，由文本类别信息熵构造代价敏感矩阵，把代价敏感极限学习机集成到Adaboost.M1 框架中。实验结果表明，该方法与其他类型的极限学习机相比较有更好的准确性和泛化性。

同行评议状态:待评议

点击量 3688 下载量 1920 评论 0

友情链接: PubScholar 哲学社会科学预印本

运营单位: 中国科学院文献情报中心
制作维护：中国科学院文献情报中心知识系统部
邮箱: eprint@mail.las.ac.cn
地址：北京中关村北四环西路33号

招募预印本评审专家许可声明法律声明

京ICP备05002861号-25 | 京公网安备110402500046号
版权所有© 2016 中国科学院文献情报中心