分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2020-09-28 合作期刊: 《计算机应用研究》
摘要: 针对传统聚类算法无法处理大数据中多视图高维数据问题,提出了一种基于混沌粒子群优化算法的智能加权K均值聚类算法。首先,在聚类模型中引入聚类之间的耦合程度以扩大聚类的相似性。其次,为了消除初始聚类中心的敏感性,利用混沌粒子群优化算法通过全局搜索得到最优初始聚类中心、视图权重和特征权重。然后,引入一种精确摄动策略提高混沌粒子群优化算法的寻优性能。最后通过在apache spark和single node两个平台上的实验验证了提出的方法在视图多、维数高的复杂数据集条件下具有较好的聚类性能。