分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-04-12 合作期刊: 《计算机应用研究》
摘要: 针对大数据环境下聚类分析的隐私保护问题,基于MapReduce计算框架,提出了一种并行化的支持差分隐私保护和离群点消除的K-means算法。算法并行地计算数据集中各点间的欧氏距离矩阵与最近邻超球半径以导出离群点的判定阈值,并在此基础上完成差分隐私保护下的初始聚类中心选取和并行聚类过程。理论分析证明整个算法满足ε-差分隐私保护,实验结果说明该算法在隐私保护的有效性,聚类结果的可用性以及执行效率等方面取得了很好的平衡,相比于同类算法有较优的表现。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-08-13 合作期刊: 《计算机应用研究》
摘要: 针对彩色图像质量无法实时评价及优化的问题,提出了基于K-均值聚类的彩色图像质量评价及优化算法。该算法首先利用K-均值聚类的方式构建样本数据集;然后通过待评价图像与聚类数据集之间的相似性来构建特征集;之后再将待优化图像与聚类数据集之间进行融合,对融合后的矩阵进行PCA变换实现了图像质量的优化;通过实验证明,所提评价算法与人眼主观视觉具有较好的一致性;同时,还能通过评价结果实现图像质量的自适应优化。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2020-09-28 合作期刊: 《计算机应用研究》
摘要: 针对传统聚类算法无法处理大数据中多视图高维数据问题,提出了一种基于混沌粒子群优化算法的智能加权K均值聚类算法。首先,在聚类模型中引入聚类之间的耦合程度以扩大聚类的相似性。其次,为了消除初始聚类中心的敏感性,利用混沌粒子群优化算法通过全局搜索得到最优初始聚类中心、视图权重和特征权重。然后,引入一种精确摄动策略提高混沌粒子群优化算法的寻优性能。最后通过在apache spark和single node两个平台上的实验验证了提出的方法在视图多、维数高的复杂数据集条件下具有较好的聚类性能。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-10-11 合作期刊: 《计算机应用研究》
摘要: 针对软件定义网络(SDN)泛洪攻击导致的上层性能瓶颈和过载问题,提出一种分布式自组织映射(DSOM)结合K-均值聚类的网络流量攻击检测方法。首先,位于应用层的DSOM控制器将现有数据集发送给集成了DSOM扩展包的交换机,在每个交换机上分别训练DSOM映射;然后,在预定时间内合并DSOM映射;最后,DSOM控制器将合并后的DSOM映射发送到所有OpenFlow交换机,利用K-均值聚类完成最终的分类。实验结果表明,DSOM方案能够有效检测异常流量、解决瓶颈问题,相比传统方法具有一定的优势。此外,提出的方法提高了系统对攻击流量的反应速度,同时给网络系统带来较小的开销。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-05-20 合作期刊: 《计算机应用研究》
摘要: 为了实现服装仿真中服装与人体的快速碰撞检测,提出了一种基于椭球拟合的碰撞检测方法。首先,以测地距离等值线为基础数据,结合人体尺寸与身高的线性关系和人体结构特征提取模型特征点,实现模型语义分割;然后,以径向距离的平均值作为椭球与模型之间的拟合误差,采用剪枝优化的二分K均值聚类算法逐步增加聚类中心个数,实现对人体模型的快速聚类并生成一系列逼近模型的最小体积包围椭球;最后,使用生成的包围椭球代替人体模型与布料进行碰撞检测。实验结果表明,该方法不仅能快速实现对三维人体模型的高度拟合,而且有效提高了碰撞检测的计算效率。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-06-19 合作期刊: 《计算机应用研究》
摘要: 针对铁路电务设备故障频发、运行效率低且无有效故障预测方法等现实问题,提出一种基于K-均值—邻域近似条件熵与BP神经网络(KNE-BPNN)的电务设备故障预测模型。首先,采用基于K-均值聚类的样例约简算法约简设备故障决策表中的冗余样例;其次,运用邻域近似条件熵属性约简方法对样例约简后故障决策表中的非必要属性进行约简;最后,使用经过样例和属性约简后的样本集训练BP神经网络并进行模型预测,直到模型输出结果满足预设条件为止。实验结果表明KNE-BPNN故障预测模型的预测精度和泛化性能均满足电务设备管理的实际需求。