Current Location:home > Browse

1. chinaXiv:202009.00109 [pdf]

基于MapReduce的并行频繁项集挖掘算法研究

刘卫明; 张弛; 毛伊敏
Subjects: Computer Science >> Integration Theory of Computer Science

针对并行MRPrePost (parallel PrePost algorithm based on MapReduce)频繁项集挖掘算法在大数据环境存在运行时间长,内存占用量大和节点负载不均衡的问题。提出一种基于DiffNodeset的并行频繁项集挖掘算法—PFIMD(parallel frequent itemsets mining using DiffNodeset)。该算法首先采用一种数据结构DiffNodeset,有效的避免了N-list基数过大的问题;此外提出一种双向比较策略“T-wcs”(2-way comparison strategy),以减少两个DiffNodeset在连接过程中的无效计算,极大的降低了算法时间复杂度;最后考虑到集群负载对并行算法效率的影响,进一步提出了一种基于动态分组的负载均衡策略“LBSBDG”(load balancing strategy based on dynamic grouping),该策略通过将频繁1项集F-list中的每项进行均匀分组,降低了集群中每个计算节点上PPC-Tree树的规模,进而减少了先序后序遍历PPC-Tree树所需的时间。实验结果表明,该算法在大数据环境下进行频繁项集挖掘具有较好的效果。

submitted time 2020-09-28 From cooperative journals:《计算机应用研究》 Hits1211Downloads33 Comment 0

2. chinaXiv:201905.00024 [pdf]

基于方形领域的网格密度聚类算法

兰红; 朱合隆
Subjects: Computer Science >> Integration Theory of Computer Science

针对大数据聚类低效的问题,提出一种方形邻域快速网格密度聚类算法SGBSCAN (square-neighborhood and Grid-based DBSCAN)。首先给出方形邻域密度聚类定义,利用方形邻域代替圆形邻域,降低时间复杂度;其次提出方形邻域密度聚类的Grid概念,快速确定高密度区域内核心点与数据点之间的密度关系;最后提出Grid密度簇,利用网格之间的关系加快密度簇的形成。算法应用于16个数据集,分别与已有文献算法进行对比,结果表明所提算法在聚类效率方面有显著提升,数据量越大算法效率提升越明显,且所提算法适用于多维数据的聚类。

submitted time 2019-05-10 From cooperative journals:《计算机应用研究》 Hits14079Downloads553 Comment 0

3. chinaXiv:201904.00051 [pdf]

基于模糊蚁群的加权蛋白质复合物识别算法

毛伊敏; 刘银萍; 胡健
Subjects: Computer Science >> Integration Theory of Computer Science

针对蚁群融合模糊C-means (FCM)聚类算法在蛋白质相互作用网络中进行复合物识别的准确率不高、召回率较低以及时间性能不佳等问题进行了研究,提出一种基于模糊蚁群的加权蛋白质复合物识别算法FAC-PC (algorithm for identifying weighted protein complexes based on fuzzy ant colony clustering)。首先,融合边聚集系数与基因共表达的皮尔逊相关系数构建加权网络;其次提出EPS (essential protein selection)度量公式来选取关键蛋白质,遍历关键蛋白质的邻居节点,设计蛋白质适应度PFC (protein fitness calculation)来获取关键组蛋白质,利用关键组蛋白质替换种子节点进行蚁群聚类,克服蚁群算法中因大量拾起放下和重复合并过滤操作而导致准确率和收敛速度过慢的缺陷;接着设计相似度SI (similarity improvement)度量优化拾起放下概率来对节点进行蚁群聚类进而获得聚类数目;最后将关键蛋白质和通过蚁群聚类得到的聚类数目初始化FCM算法,设计隶属度更新策略来优化隶属度的更新,同时提出兼顾类内距和类间距的FCM迭代目标函数,最终利用改进的FCM完成复合物的识别。将FAC-PC算法应用在DIP数据上进行复合物的识别,实验结果表明FAC-PC算法的准确率和召回率较高,能够较准确地识别蛋白质复合物。

submitted time 2019-04-01 From cooperative journals:《计算机应用研究》 Hits15829Downloads1786 Comment 0

4. chinaXiv:201901.00025 [pdf]

融合标签相似度的差分隐私矩阵分解推荐算法

郑剑; 王啸乾
Subjects: Computer Science >> Integration Theory of Computer Science

推荐系统需要利用到大量的用户行为数据,这些数据极有可能暴露用户的喜好,给人们关心的隐私问题带来了巨大的挑战。为保证推荐精度与用户隐私,提出一种结合差分隐私与标签信息的矩阵分解推荐模型。该模型首先将标签信息加入到项目相似度的计算过程,随后融入到矩阵分解推荐模型中提高推荐精度,最后运用随机梯度下降法求解模型最优值。为解决用户隐私问题,将拉普拉斯噪声划分成两部分,分别加入项目相似度与梯度求解过程中,使得整个推荐过程满足ε-差分隐私,并在一个真实的数据集上分析验证算法的有效性。实验表明,提出的方法能在保证用户隐私的情况下,仍具有较高的推荐精度。

submitted time 2019-01-03 From cooperative journals:《计算机应用研究》 Hits443Downloads258 Comment 0

5. chinaXiv:201901.00049 [pdf]

结合评分比例因子及项目属性的协同过滤算法

李淑芝; 李志军; 邓小鸿
Subjects: Computer Science >> Integration Theory of Computer Science

针对传统的协同过滤算法存在用户评分矩阵稀疏及未考虑项目属性之间关系的问题,提出了结合评分比例因子及项目属性的协同过滤算法。首先利用评分矩阵得出项目之间的共同与非共同评分用户数量比矩阵,以此增加项目共同评分用户的影响度,减少用户—项目评分矩阵的稀疏性对项目相似度计算带来的误差;然后对项目属性量化得出其对项目相似度的影响权重,提高项目相似度计算的准确性,根据以上两点提出了一种结合评分比例因子及项目属性权重作为项目相似度权重的算法。实验结果表明该算法在召回率和准确率上相比现有的方法分别提高了5.1%和4.7%,算法适用于电商类网站的个性化推荐。

submitted time 2019-01-03 From cooperative journals:《计算机应用研究》 Hits518Downloads290 Comment 0

6. chinaXiv:201812.00124 [pdf]

基于蚁群聚类的动态加权PPI网络复合物挖掘

胡健; 朱海湾; 毛伊敏
Subjects: Computer Science >> Integration Theory of Computer Science

针对基于蚁群聚类的蛋白质复合物挖掘算法中,静态PPI网络难以真实反映细胞的动态特性,收敛速度较慢、聚类准确性和召回率不高等问题进行了研究,提出一种基于模糊粒度和紧密度的蚁群聚类的动态加权PPI网络复合物挖掘方法(joint fuzzy granular and closeness degree ant colony clustering-DPC,FGCDACC-DPC)。首先基于动态PPI网络的拓扑特性和生物特性设计了综合性权值度量(comprehensive weight metric,CWM),准确描述了蛋白质之间的相互作用;其次根据复合物的基本特征,构建一组稠密且高度共表达的复合核,然后设计模糊粒度和紧密度的拾起放下模型对其余节点聚类,降低了计算复杂度和随机性,加快聚类速度;最后基于功能信息传递和时序功能相关的思想分别构建了局部和全局权值更新策略,实现不同代蚁群和不同时刻网络之间的功能信息传递,提高聚类准确性。将FGCDACC-DPC算法应用在DIP数据上进行复合物挖掘,实验结果表明该算法的精度和召回率较高,能够较准确地识别蛋白质复合物。

submitted time 2018-12-13 From cooperative journals:《计算机应用研究》 Hits526Downloads300 Comment 0

7. chinaXiv:201808.00074 [pdf]

一种基于元信息的Android恶意软件检测方法

李江华; 邱晨
Subjects: Computer Science >> Integration Theory of Computer Science

Android应用普遍具有比所属类型更多的功能,需要获取更多的权限,过多的权限可能带来一定的安全隐患。针对这类问题,提出一种基于元信息的Android恶意软件检测方法。首先,通过对Android应用程序描述进行LDA主题提取,实现数据降维,使用K-means聚类算法按照功能类型对应用程序分组;然后,对属于同一功能类型的所有应用程序,提取其权限信息,以权限特征为研究对象,使用kNN算法进行Android恶意软件的分类检测。实验结果获得94.81%的平均准确率,证明方法的有效性和高准确率。

submitted time 2018-08-13 From cooperative journals:《计算机应用研究》 Hits486Downloads283 Comment 0

8. chinaXiv:201805.00235 [pdf]

不确定NNSB-OPTICS聚类算法在滑坡危险性预测中的研究与应用

毛伊敏; 陈华彬; 李忠利; 张灿龙
Subjects: Computer Science >> Integration Theory of Computer Science

针对滑坡危险性预测中降雨等不确定因素不能有效刻画及处理和现有的OPTICS-PLUS聚类算法需要设置密度阈值、时间复杂度高等问题进行了研究,为了提高滑坡危险性预测准确率,提出一种不确定NNSB-OPTICS聚类算法并应用于滑坡预测中。首先对OPTICS-PLUS算法扩张策略进行优化,避免了人工设置密度阈值,提高了算法效率;然后根据降雨量数据的分布特征,综合EW型距离公式和云模型理论,提出EC型距离公式,有效处理不确定数据降雨量;最后将不确定NNSB-OPTICS聚类算法应用于延安市宝塔区滑坡危险性预测中,建立滑坡危险性预测模型,滑坡预测精度达到89.7%。实验结果表明,该方法能够有效提高滑坡危险性预测精度,具有较高可行性。

submitted time 2018-05-20 From cooperative journals:《计算机应用研究》 Hits918Downloads624 Comment 0

9. chinaXiv:201805.00247 [pdf]

结合纹理复杂度和JND模型的图像水印算法

李淑芝; 龙香玉; 邓小鸿; 周永新
Subjects: Computer Science >> Integration Theory of Computer Science

针对目前基于灰度共生矩阵相关水印算法存在容量较小的问题,提出一种将纹理复杂度和DCT域JND模型相结合的图像水印算法。首先将原图像分成子块,利用各子块灰度共生矩阵的四个纹理特性计算其纹理复杂度,并据此对子块进行排序以确定水印嵌入的子块位置后对原图像素矩阵进行DCT变换,结合新的分区方式计算各块JND值,根据JND值以及新的嵌入规则确定子块内水印嵌入方式。算法有效考虑了图像块的纹理特性和人眼视觉敏感性,加强了嵌入水印后的图像质量,提高了水印嵌入容量。实验结果表明,所提方法在嵌入相同容量的水印时,图像平均峰值信噪比(PSNR)较现有方法高出4.27%左右,在嵌入超过原方法容量上限一倍的水印时,图像平均PSNR仍有53.449 8 dB。

submitted time 2018-05-20 From cooperative journals:《计算机应用研究》 Hits894Downloads650 Comment 0

10. chinaXiv:201804.02059 [pdf]

不确定PAHT聚类算法在滑坡危险性预测上的应用

胡健; 朱玲; 毛伊敏
Subjects: Computer Science >> Integration Theory of Computer Science

针对滑坡预测聚类研究中由于难以确定传统聚类算法需要预先设置的簇个数和无法精准衡量不确定因素降雨量导致预测效果欠佳的问题,提出一种新的聚类算法—不确定PAHT(partition algorithm on the hierarchical thinking)算法,该算法引入一种不确定数据模型——M-D距离,其有效刻画了不确定的雨量数据;并结合层次聚类思想,通过找出最佳阙值p*自动确定k值。以延安宝塔区为实例进行对比实验,实验结果验证了不确定M-D距离和PAHT算法的有效性及不确定PAHT算法在滑坡危险性预测上的可行性。

submitted time 2018-04-19 From cooperative journals:《计算机应用研究》 Hits622Downloads366 Comment 0

12  Last  Go  [2 Pages/ 11 Totals]