Current Location:home > Browse

1. chinaXiv:201901.00173 [pdf]

基于K-means和naive Bayes的数据库用户行为异常检测研究

王旭仁; 冯安然; 何发镁; 马慧珍; 杨杰
Subjects: Computer Science >> Integration Theory of Computer Science

针对数据库用户行为异常导致数据库泄露问题,提出了一种基于K-means和naive Bayes算法的数据库用户异常检测方法。首先,利用数据库历史审计日志中用户的查询语句与查询结果,采用K-means聚类方法得到用户的分组;然后,使用naive Bayes分类算法构造用户异常检测模型。与单独使用naive Bayes分类法构造的模型相比,在数据预处理时精简了用户行为轮廓的表示方法,降低了计算冗余,减少了81%的训练时间;利用K-means聚类方法得到用户组别,使检测的精确率提高了7.06%,F1值提高了3.33%。实验证明,所提方法大幅降低训练时间,取得了良好的检测效果。

submitted time 2019-01-28 From cooperative journals:《计算机应用研究》 Hits337Downloads216 Comment 0

2. chinaXiv:201805.00475 [pdf]

结合用户兴趣度聚类的协同过滤推荐算法

黄贤英; 龙姝言; 谢晋
Subjects: Computer Science >> Integration Theory of Computer Science

针对传统的协同过滤算法忽略了用户兴趣源于关键词以及数据稀疏的问题,提出了结合用户兴趣度聚类的协同过滤推荐算法。利用用户对项目的评分,并从项目属性中提取关键词,提出了一种新的RF-IIF (rating frequency- inverse item frequency)算法,根据目标用户对某关键词的评分频率和该关键词被所有用户的评分频率,得到用户对关键词的偏好,形成用户—关键词偏好矩阵,并在该矩阵基础上进行聚类。然后利用logistic函数得到用户对项目的兴趣度,明确用户爱好,在类簇中寻找目标用户的相似用户,提取邻居爱好的前N个物品对用户进行推荐。实验结果表明,算法准确率始终优于传统算法,对用户爱好判断较为准确,缓解了数据稀疏问题,有效提高了推荐的准确率和效率。

submitted time 2018-05-24 From cooperative journals:《计算机应用研究》 Hits524Downloads307 Comment 0

3. chinaXiv:201805.00182 [pdf]

基于稀疏自编码特征聚类算法的图像窜改检测

王梦思; 霍宏涛; 罗霄阳
Subjects: Computer Science >> Integration Theory of Computer Science

同图复制窜改是图像窜改较为常见的一类,基于块匹配检测方法往往存在准确率低、时间复杂度高等问题,为提高准确率并大幅度降低时间复杂度,应用深度学习特征和聚类算法进行检测。首先用稀疏自编码器训练大量样本集找出同图复制图像的内部规律并得到降维的隐藏层权值矩阵,通过权值矩阵获得检测图像的隐藏层特征,即定义的稀疏自编码特征;用K-means算法一次聚类自编码特征去除图像平滑区域,二次聚类纹理特征获得检测结果,若检测结果中含有少量异常块,通过欧氏距离判断和RANSAC(random sample consensus)算法将异常块去除,从而实现窜改区域的检测。实验结果表明,该算法与其他算法比较综合准确率提升14.3%,时间效率提升72%。将深度学习特征与聚类算法结合使用,使得同图复制窜改在时间效率和准确率上皆有所提升。

submitted time 2018-05-20 From cooperative journals:《计算机应用研究》 Hits461Downloads248 Comment 0

4. chinaXiv:201805.00266 [pdf]

基于混沌Duffing振子的BPSK信号K-means聚类解调方法

蒋亮亮; 江虹; 曾闵
Subjects: Computer Science >> Integration Theory of Computer Science

针对二进制相移键控(binary phase shift keying,BPSK)信号在低信噪比下解调误码率较高的问题,提出了一种基于混沌Duffing振子的K-means解调方法。该方法的思想是根据混沌Duffing振子系统对初值的敏感性以及对噪声的免疫特性,低信噪比下Duffing振子系统输入BPSK信号时,由于BPSK信号相位在0°和π之间的跳变从而导致Duffing振子输出相轨迹状态发生改变。针对相轨迹状态的变化,采用K-means聚类算法对相轨迹进行迭代求质心,根据收敛后的质心间距大小对BPSK信号进行判决解调。仿真结果表明,与现有的几种解调方法相比较,基于混沌Duffing振子的BPSK信号K-means聚类解调方法在低信噪比下解调速度、解调精度等方面都有了较大的提高。

submitted time 2018-05-20 From cooperative journals:《计算机应用研究》 Hits358Downloads211 Comment 0

5. chinaXiv:201804.02182 [pdf]

一种改进K-means聚类的FCMM算法

杨明极; 马池; 王娅; 张竹
Subjects: Computer Science >> Integration Theory of Computer Science

针对K-means算法易受初始聚类中心影响而陷入局部最优的问题,提出一种基于萤火虫智能优化和混沌理论的FCMM算法。首先利用最大最小距离算法确定聚类类别值K和初始聚类中心位置;然后以各聚类中心为基准点,利用Tent映射构建混沌空间,通过混沌搜索更新聚类中心,以降低初始聚类中心过于临近的影响,并改善算法易陷入局部最优的问题。仿真结果表明,FCMM算法的平均聚类精度相较于经典K-means算法和FA算法分别提高了7.51%和2.2%,成功避免算法陷入局部最优解,提高了划分初始数据集的效率和寻优精度。

submitted time 2018-04-17 From cooperative journals:《计算机应用研究》 Hits302Downloads179 Comment 0

6. chinaXiv:201712.01394 [pdf]

中国农产品品牌评价研究的内容解析*

王雪颖; 张紫玄; 王 昊; 邓三鸿
Subjects: Library Science,Information Science >> Information Science

【目的】通过分析中国农产品品牌评价领域的文献题名总结该领域的研究现状。【方法】对该领域的文献 题名进行 K-means 聚类, 分析每簇研究的重点内容, 分别使用因子分析、多维尺度分析和层次聚类分析进一步解 析聚类得到的每簇文献的特点。【结果】文献数量总体呈现“M”型趋势, 文献多采用模糊综合法, 从多个评价角 度集中探讨评价指标体系、评价模型、影响因素等方面。【局限】仅针对题名进行分析, 未涉及关键词与摘要文 本。【结论】聚类结果较好地揭示了中国该领域的研究现状, 但没有反映出种类农产品、Interband 品牌评估法相 关内容。

submitted time 2017-12-05 From cooperative journals:《数据分析与知识发现》 Hits935Downloads554 Comment 0

  [1 Pages/ 6 Totals]