分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2019-01-28 合作期刊: 《计算机应用研究》
摘要: 针对数据库用户行为异常导致数据库泄露问题,提出了一种基于K-means和naive Bayes算法的数据库用户异常检测方法。首先,利用数据库历史审计日志中用户的查询语句与查询结果,采用K-means聚类方法得到用户的分组;然后,使用naive Bayes分类算法构造用户异常检测模型。与单独使用naive Bayes分类法构造的模型相比,在数据预处理时精简了用户行为轮廓的表示方法,降低了计算冗余,减少了81%的训练时间;利用K-means聚类方法得到用户组别,使检测的精确率提高了7.06%,F1值提高了3.33%。实验证明,所提方法大幅降低训练时间,取得了良好的检测效果。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-12-13 合作期刊: 《计算机应用研究》
摘要: 底层虚拟机LLVM是一个广泛使用的编译框架,其中间表示IR中包含有丰富的程序分析信息,众多以LLVM为平台的相关工作均以IR为基础开展。数据依赖关系在错误检测、定位及程序调试等领域有着重要应用。基于IR的数据依赖关系计算多采用串行迭代方式,但在应对较大规模IR文件时可扩展性不够理想。对此,进行了数据依赖关系计算中指令读写的可并行性挖掘,结合图形处理器并行计算优势,提出一种基于LLVM IR的数据依赖关系并行计算方法DRPC。该方法以IR为输入,采用CPU-GPU双端协同方式实现程序数据依赖关系的高效计算。实验结果表明,针对基准程序集SPEC,DRPC分别在直接及传递数据依赖关系计算上最高获得了3.48x和4.91x的加速比。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-10-11 合作期刊: 《计算机应用研究》
摘要: 针对粒子滤波算法对粒子数目的大量需求等弊端,提出一种基于改进的萤火虫算法的粒子滤波。首先,在萤火虫的亮度公式中引入观测值信息,以提高算法跟踪的准确性;其次,提出自适应吸引半径参数来控制萤火虫群寻优时的吸引范围,使算法的实时性更好;最终利用萤火虫算法的迭代寻优来进行粒子更新。对比实验表明,该算法在跟踪精度和运行时间上都有所优化,说明该算法即使在粒子数目较少的条件下,也能保证目标跟踪的准确性和实时性。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-04-12 合作期刊: 《计算机应用研究》
摘要: 在人工智能快速发展的今天,智能教育逐渐成为一大研究热点。在自然语言处理方面对智能教育中智慧学习的探究,提出根据知识图谱和学科规则确定单选题考点,主要介绍知识图谱的构建和单选题考点的提取这两方面内容。通过建立一个开放性的知识图谱,不断实现学科知识的扩充。为提取考点,首先将单选题分类、分词以及替换相似词,然后通过检索图谱得到单选题的候选考点集,最后通过学科规则定位知识点及其所属章节,便于学生有针对性地复习教材知识。在所收集的C++试题集上的实验结果表明,通过知识图谱和规则可较为准确地提取出试题考点。