您当前的位置:首页 > 论文浏览

1. chinaXiv:201901.00190 [pdf]

基于最近邻距离权重的ML-KNN算法

陆凯; 徐华
分类: 计算机科学 >> 计算机科学的集成理论

在大数据环境下,K近邻多标签算法(ML-KNN)高时间复杂度的问题显的尤为突出;此外,ML-KNN也没有考虑k个近邻对最终分类结果的影响。针对上述问题进行研究,首先将训练集进行聚类,再为测试集找到一个距离其最近的训练数据簇作为新的训练数据集;然后计算最近邻样本的距离权重,并用该权重描述最近邻和其他近邻对预测结果的影响;最后使用新的目标函数为待测样本分类。通过在图片、Web页面文本数据等数据集上的实验表明,所提算法得到了更好的分类结果,并且大大降低了时间复杂度。

提交时间: 2019-01-28 来自合作期刊:《计算机应用研究》 点击量52下载量33 评论 0

2. chinaXiv:201812.00104 [pdf]

基于混合互信息算法的文本情感分析

王义; 戴月明
分类: 计算机科学 >> 计算机科学的集成理论

针对互信息(mutual information, MI)特征选择方法存在的正负相关性的现象以及未考虑特征项在不同类别内词频的问题,提出了一种混合互信息特征选择算法(hybrid mutual information, HMI)。该算法引入逆文档频率系数和类间词频信息系数,使得整个文档中的词频信息以及每个类之间的词频信息得以有效利用;引入正负相关性系数,区分正相关性和负相关性,并进行有效的利用。通过实验对比表明,混合互信息算法可以有效地提高特征选择的质量,进而提高文本情感分析的效果。

提交时间: 2018-12-13 来自合作期刊:《计算机应用研究》 点击量99下载量57 评论 0

3. chinaXiv:201811.00150 [pdf]

基于自然最近邻相似图的谱聚类

刘友超; 张曦煌
分类: 计算机科学 >> 计算机科学的集成理论

谱聚类是基于谱图划分理论的一种聚类算法,由于其对非凸数据集具有优越的性能而广受欢迎,但是传统谱聚类算法经常在处理一些结构复杂的数据集时效果不甚理想,并且其相似度矩阵构造时参数的选取往往需要依靠多次实验及个人经验。在这种情况下,提出一种基于自然最近邻相似图的谱聚类(NSG-SC)算法。自然最近邻是一种新颖的最近邻概念,可以有效地避免K最近邻以及ε-最近邻方法需要人为设置参数的缺点。该算法构造相似度矩阵时依靠数据集自身的特性进行搜索,避免了参数选取不当以及离散点所带来的影响,更加真实地反映了数据集的结构关系。实验结果表明,提出的NSG-SC算法具有可行性和有效性。

提交时间: 2018-11-29 来自合作期刊:《计算机应用研究》 点击量99下载量65 评论 0

4. chinaXiv:201811.00200 [pdf]

智能仿生算法在移动机器人路径规划优化中的应用综述

于振中; 李强; 樊启高
分类: 计算机科学 >> 计算机科学的集成理论

路径规划优化问题一直是移动机器人研究的重要课题之一。随着移动机器人应用领域的扩大和工作环境的复杂化,传统路径规划算法因其自身局限性变得难以满足人们的要求。近年来,智能仿生算法因其群集智慧和生物择优特性而被广泛应用于移动机器人路径规划优化中。首先,按照智能仿生算法仿生机制的来源,对应用于路径规划优化中的智能仿生算法进行了分类。然后,按照不同的类别,系统的叙述了各种新型智能仿生算法在路径规划优化中取得的最新研究成果,总结了路径规划优化过程中存在的问题以及解决方案,并对算法在路径规划优化中的性能进行了比较分析。最后对智能仿生算法在路径规划优化中的研究方向进行了探讨。

提交时间: 2018-11-29 来自合作期刊:《计算机应用研究》 点击量160下载量86 评论 0

5. chinaXiv:201810.00062 [pdf]

基于Spark并行的密度峰值聚类算法

孙伟鹏; 吴锡生; 孟斌
分类: 计算机科学 >> 计算机科学的集成理论

针对FSDP聚类算法在计算数据对象的局部密度与最小距离时,由于需要遍历整个数据集而导致算法的整体时间复杂度较高的问题,提出了一种基于Spark的并行FSDP聚类算法SFSDP。首先,算法通过空间网格划分将待聚类数据集划分成多个数据量相对均衡的数据分区;然后,利用改进的FSDP聚类算法并行地对各个分区内的数据执行聚类分析;最后,通过将分区间的局部簇集合并,生成全局簇集。实验结果表明,SFSDP与FSDP算法相比能够有效地进行大规模数据集的聚类分析工作,并且算法在准确性和扩展性方面都有很好的表现。

提交时间: 2018-10-11 来自合作期刊:《计算机应用研究》 点击量103下载量63 评论 0

6. chinaXiv:201805.00477 [pdf]

稀疏和标签约束半监督自动编码机的分类算法

王慧玲; 宋威; 王晨妮
分类: 计算机科学 >> 计算机科学的集成理论

自动编码机通过深度无监督学习能够表达数据的语义特征,但由于其隐含层节点个数难以有效确定,所处理的数据进一步用于分类时常会导致分类准确度低,稳定性弱等问题。针对这些问题,提出了一种稀疏和标签约束的半监督自动编码机(SLRAE),以实现无监督学习与监督学习的有机结合,更准确地抽取样本的本质特征。稀疏约束项针对每个隐含结点的响应添加约束条件,从而在隐含神经元数量较多的情况下仍可发现数据中潜在的结构;同时引入标签约束项,以监督学习的方式比对实际标签与期望标签,针对性地调整网络参数,进一步提高分类准确率。为验证所提方法的有效性,实验中对多个数据集进行广泛地测试,其结果表明,相对传统自动编码机(AE),稀疏自动机(SAE),以及极限学习机(ELM),SLRAE所处理的数据应用于同一分类器,能明显提高分类准确率和稳定性。

提交时间: 2018-05-24 来自合作期刊:《计算机应用研究》 点击量209下载量134 评论 0

7. chinaXiv:201805.00218 [pdf]

基于雅克比稀疏自动编码机的手写数字识别算法

王慧玲; 宋威
分类: 计算机科学 >> 计算机科学的集成理论

由于手写数字边缘轮廓差异大造成书写风格的不同,为了提高识别准确度,通过在自动编码机中加入稀疏约束项和雅克比正则项,提出一种雅克比稀疏自动编码机(JSAE)的算法进行手写数字识别。加入稀疏约束项能够有效提取数据中的隐藏结构,而雅克比正则化可以描述数据点的边缘特征,提高自动编码器算法的学习能力,从而更准确地抽取样本的本质特征。实验结果表明,JSAE在分类准确率上要高于自动编码机(AE)和稀疏自动编码机(SAE)算法。

提交时间: 2018-05-20 来自合作期刊:《计算机应用研究》 点击量206下载量131 评论 0

8. chinaXiv:201805.00254 [pdf]

基于L1范数的形状快速匹配算法

王江辉; 吴小俊
分类: 计算机科学 >> 计算机科学的集成理论

针对内距离形状上下文IDSC(inner-distance shape context)和轮廓点分布直方图CPDH(contours points distribution histogram)在形状相似性度量中直方图匹配耗时长,工程应用性不佳的问题,提出了一种用EMD-L1测量轮廓特征直方图的距离的方法。EMD-L1在原始EMD (earth mover’s distance)的基础上融合了L1范数,通过替换地面距离计算方法,减少了目标函数的变量,加快了直方图匹配的速度,能够快速实现形状匹配并保持较好的检索性能。对形状数据集进行仿真实验的结果证明,该方法能够有效地进行数据集的形状识别和检索,并且在MNIST数据集下的匹配速度优于其他算法。

提交时间: 2018-05-20 来自合作期刊:《计算机应用研究》 点击量169下载量110 评论 0

9. chinaXiv:201805.00365 [pdf]

虚拟化与数字仿真融合的网络仿真任务划分

吴文燕; 姜鑫; 王晓锋; 刘渊
分类: 计算机科学 >> 计算机科学的集成理论

为提升网络仿真性能,面向虚拟化与数字仿真融合的网络仿真体系架构,研究相应的网络仿真任务划分方法。综合考虑虚拟化与数字仿真各自优势,将网络拓扑分为虚拟化拓扑区域与数字仿真拓扑区域,结合给定物理资源,以负载均衡与远程通信量最小化为目标,对两种区域进行融合划分。实验表明,通过该方法进行网络仿真任务划分相对于随机算法与均衡负载平衡算法,远程通信量分别平均降低33.7%,25.1%,负载均衡度分别平均提升56.3%,38.0%。该方法可有效降低远程通信量与提升负载均衡度。

提交时间: 2018-05-18 来自合作期刊:《计算机应用研究》 点击量249下载量142 评论 0

10. chinaXiv:201805.00046 [pdf]

新模糊聚类有效性指标

耿嘉艺; 钱雪忠; 周世兵
分类: 计算机科学 >> 计算机科学的集成理论

模糊聚类是模式识别、机器学习和图像处理等领域的重要研究内容。模糊C-均值聚类算法是最常用的模糊聚类实现算法,该算法需要预先给定聚类数才能对数据集进行聚类。提出了一种新的聚类有效性指标,对聚类结果进行有效性验证。该指标从划分熵、隶属度、几何结构角度,定义了紧凑度、分离度、重叠度三个重要特征测量。在此基础上,提出了一种最佳聚类数确定方法。将新聚类有效性指标和传统有效性指标在6个人工数据集和3个真实数据集进行实验验证。实验结果表明,所提出的指标和方法能够有效地对聚类结果进行评估,适合确定样本的最佳聚类数。

提交时间: 2018-05-02 来自合作期刊:《计算机应用研究》 点击量173下载量109 评论 0

12  尾页  转到  [2 页/ 13 条记录]