您当前的位置:首页 > 论文浏览

1. chinaXiv:201901.00185 [pdf]

基于平滑L1范数的深度稀疏自动编码器社区识别算法

张军祥; 李书琴; 刘斌
分类: 计算机科学 >> 计算机科学的集成理论

大数据时代,利用传统的社区发现算法对大规模复杂网络进行社区结构挖掘显得愈发困难,准确率也较低。因此,提出一种基于平滑L_1范数的深度稀疏自编码器社区发现算法L_1-ECDA(community discovery algorithm for deep sparse self-encoder based on smooth L_1 norm)。该算法首先采用基于s跳的方法对网络图的邻接矩阵进行预处理;然后构建基于平滑L_1范数的深度稀疏自编码器,并通过训练网络图相似度矩阵得到低维特征矩阵;最后采用K-means算法对低维特征矩阵进行聚类得到网络社区结构。通过在仿真网络与真实网络数据集上实验表明,L_1-ECDA算法有效提高了社区识别的准确率,且比DBCS算法准确率平均高4%,比Deepwalk算法和CoDDA算法平均高5.4%。

提交时间: 2019-01-28 来自合作期刊:《计算机应用研究》 点击量79下载量30 评论 0

2. chinaXiv:201808.00100 [pdf]

平台下粒子滤波结合改进ABC算法的IoT大数据特征选择方法

吴颖; 李晓玲; 唐晶磊
分类: 计算机科学 >> 计算机科学的集成理论

针对现有物联网大数据特征选择算法计算效率低下、可扩展性不高的问题,提出一种基于改进人工蜂群(ABC)选择特征的系统架构,该架构包含四层体系,可以高效地聚合有效数据,剔除不需要的数据。整个系统是基于Hadoop平台、MapReduce以及改进ABC算法的。改进ABC算法用于选择特征,而MapReduce则由并行算法支持,该算法可高效处理大量数据集。该系统使用MapReduce工具实现,并利用粒子滤波来消除噪声。将所提出的算法与同类方法进行比较,并通过使用十个不同的数据集对效率、准确性和吞吐量进行评估。结果表明,相比其他几种较新的算法,提出的算法在选择特征时更具可扩展性和高效性。

提交时间: 2018-08-13 来自合作期刊:《计算机应用研究》 点击量99下载量70 评论 0

3. chinaXiv:201805.00442 [pdf]

无人机影像与地形指数结合的梯田信息提取

薛牡丹; 张宏鸣; 杨江涛; 李星恕
分类: 计算机科学 >> 计算机科学的集成理论

目前,通过卫星遥感、低空遥感影像自动,半自动化解译梯田信息有一定的研究进展,但是受数据获取成本、精度、解译方法单一等限制,只限于大面积提取梯田区域。低成本地进行梯田的田面精准提取以及面积统计仍需进一步研究。基于面向对象方法分别对0.5m分辨率的无人机正射影像和地形指数,及两种数据的结合进行梯田区域分割、提取及面积统计。结果表明,将正射影像数据与地形指数结合的梯田的田面提取结果优于基于单一数据源。

提交时间: 2018-05-24 来自合作期刊:《计算机应用研究》 点击量150下载量105 评论 0

4. chinaXiv:201805.00207 [pdf]

BioTrHMM:基于迁移学习的生物医学命名实体识别算法

高冰涛; 张阳; 刘斌
分类: 计算机科学 >> 计算机科学的集成理论

传统的生物医学命名实体识别方法需要大量目标领域的标注数据,但是标注数据代价高昂。为了降低生物医学文本中命名实体识别对目标领域标注数据的需求,将生物医学文本中的命名实体识别问题化为基于迁移学习的隐马尔可夫模型问题。对要进行命名实体识别的目标领域数据集无须进行大量数据标注,通过迁移学习的方法实现对目标领域的识别分类。以相关领域数据为辅助数据集,利用数据引力的方法评估辅助数据集的样本在目标领域学习中的贡献程度,在辅助数据集和目标领域数据集上计算权值进行迁移学习。基于权值学习模型,构建基于迁移学习的隐马尔可夫模型算法BioTrHMM。在GENIA语料库的数据集上的实验表明,BioTrHMM算法比传统的隐马尔可夫模型算法具有更好的性能;仅需要少量的目标领域标注数据,即可具有较好的命名实体识别性能。

提交时间: 2018-05-20 来自合作期刊:《计算机应用研究》 点击量257下载量137 评论 0

5. chinaXiv:201804.02398 [pdf]

一种改进的个性化查询引文推荐方法

李飞; 张宏鸣; 蔡晓妍; 刘斌; 郭蓝天
分类: 计算机科学 >> 计算机科学的集成理论

为充分利用文本内容的上下文信息,结合图模型及查询向量的构建方法,提出一种融合查询内容信息的个性化引文推荐方法。通过三种论文信息构建三层图模型,并在不同层上设置不同参数,调整节点向不同层次的跳转概率;利用word2vec技术构建的查询向量,可以有效利用文本上下文内容信息,使相似的文章在距离上更加接近,进而对候选文章进行评分预测与论文推荐。在Association of Computational Linguistics Anthology Network数据集上进行计算分析,相同查询下与原有的方法相比在recall@N上平均提高约7%,在NDCG@N上平均提高约11%。实验结果表明该方法可以使引文推荐的质量得到有效的提升,能够获得较好的推荐效果。

提交时间: 2018-04-24 来自合作期刊:《计算机应用研究》 点击量246下载量154 评论 0

6. chinaXiv:201804.01441 [pdf]

基于MapReduce模型的侵蚀地形因子计算方法研究

王猛; 张宏鸣
分类: 计算机科学 >> 计算机科学的集成理论

针对传统侵蚀地形因子提取方法在处理海量数据时出现的瓶颈,提出一种基于MapReduce模型的侵蚀地形因子计算方法。该方法将并行计算模型MapReduce与改进的通用土壤流失方程(revised universal soil loss equation,RUSLE)相结合。利用最大坡降原理和B+树建立流向关系查找树来表现地形数据的相关性;利用MapReduce模型进行流路查找与栅格汇聚来替代传统正反向遍历算法,解决侵蚀地形因子计算过程中汇水和累计坡长的计算效率问题。实验结果表明,对于基于海量数字高程模型数据的地形因子提取,该方法能够在计算精度允许的范围内有效提高效率。

提交时间: 2018-04-12 来自合作期刊:《计算机应用研究》 点击量177下载量100 评论 0

  [1 页/ 6 条记录]