分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2020-09-28 合作期刊: 《计算机应用研究》
摘要: 高效用模式挖掘(high utility pattern mining,HUPM)是近年来研究的新兴主题。效用的概念为分析人员挖掘相关项集提供了更大的灵活性,以用户的需求为出发点,从权重、值、数量和其他信息进行度量。通过分析有关HUPM最先进的方法,对其进行全面和结构化的概述。首先,通过介绍HUPM的相关概念、公式,并给出应用示例,对HUPM有更深一步的理解。针对用于挖掘不同类型HUPM的最常见和最先进的关键技术的进行分类,包括基于Apriori,基于树,基于列表,基于映射,基于垂直/水平数据格式,基于索引等方法。针对现有关键技术的用途和优缺点,进行了全面概述。然后,由于静态数据难以满足实际需要,总结了在数据流上应用的HUPM方法,主要包括基于增量方法,基于滑动窗口模型方法,基于时间衰减模型方法,基于地标模型方法等。最后,给出了现在技术的不足和改进方向,并且有针对性的提出了新的研究方法。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-11-29 合作期刊: 《计算机应用研究》
摘要: 当前,数据流分类算法的潮流是集成分类算法,因为集成算法提供了比单分类算法更好的性能和更突出的表现。同时在现实世界的实际应用中容易部署,对概念漂移有快速的适应性和恢复性,而且在类不平衡问题的处理中也具有最佳的分类性能。详细介绍了国内外集成分类算法,对集成分类算法的两个部分(基分类器组合和动态更新集成模型)进行了详细综述,明确区分不同集成算法的优缺点,对比算法和实验数据集。并且提出进一步的研究方向和考虑的解决办法。