您当前的位置: > 详细浏览

基于改进CFSFDP 算法的文本聚类方法及其应用

摘要:【目的】针对CFSFDP(Clustering by Fast Search and Find of Density Peaks)算法利用局部密度和距离的乘积选择聚类中心而导致聚类结果不理想的问题进行改进。【方法】提出一种基于粒子群算法的CFSFDP 算法, 通过粒子群算法寻找CFSFDP 算法中的最佳局部密度和距离阈值, 得到相对较高的局部密度和距离的聚类中心, 减少离散点对数据中心选取的影响, 并在某高考咨询平台提供的考生问题库中随机选取数据集进行试验。【结果】实验结果表明, 在不同的数据集中, 本文算法相对于基本的CFSFDP 算法在准确率、召回率、F 值上均有明显提高。【局限】文本处理时没有考虑语义关系。【结论】本文方法有很好的聚类效果, 应用在高考咨询库中能够有效地减轻被咨询方的工作量并且帮助快速回答考生的问题。

版本历史

[V1] 2017-11-08 16:30:54 ChinaXiv:201711.01936V1 下载全文
点击下载全文
许可声明
metrics指标
  • 点击量25475
  • 下载量1344
评论
分享
邀请专家评阅