分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2019-04-01 合作期刊: 《计算机应用研究》
摘要: 针对树木点云拓扑结构复杂、特征细节繁多等问题,提出一种基于点云收缩提取曲线骨架的算法。首先,为了在点云表面直接应用网格收缩算法,对点云进行局部主成分分析和Delaunay三角剖分;其次,针对树木点云拓扑结构复杂和末枝细节繁多等问题,用曲率法线流算子对点云进行收缩,针对树木枝条细长且弯曲幅度平缓等特点,利用\改进后的QEM网格简化方法将三角网格折叠成一维曲线骨架;最后,将得到的曲线骨架进行连通和居中处理。提出的算法直接在点云上进行操作,不需要额外的信息和预处理操作,对噪声和残缺点云有良好的鲁棒性。实验证明,该算法提取的树木点云骨架充分表达了树木在自然环境下的生物性结构和特征,相对于rosa、L1-中轴等经典算法,在树木点云的骨架提取速度上提高3倍以上,枝条重建度提高25%。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2019-01-28 合作期刊: 《计算机应用研究》
摘要: 大数据时代,利用传统的社区发现算法对大规模复杂网络进行社区结构挖掘显得愈发困难,准确率也较低。因此,提出一种基于平滑L_1范数的深度稀疏自编码器社区发现算法L_1-ECDA(community discovery algorithm for deep sparse self-encoder based on smooth L_1 norm)。该算法首先采用基于s跳的方法对网络图的邻接矩阵进行预处理;然后构建基于平滑L_1范数的深度稀疏自编码器,并通过训练网络图相似度矩阵得到低维特征矩阵;最后采用K-means算法对低维特征矩阵进行聚类得到网络社区结构。通过在仿真网络与真实网络数据集上实验表明,L_1-ECDA算法有效提高了社区识别的准确率,且比DBCS算法准确率平均高4%,比Deepwalk算法和CoDDA算法平均高5.4%。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-08-13 合作期刊: 《计算机应用研究》
摘要: 针对现有物联网大数据特征选择算法计算效率低下、可扩展性不高的问题,提出一种基于改进人工蜂群(ABC)选择特征的系统架构,该架构包含四层体系,可以高效地聚合有效数据,剔除不需要的数据。整个系统是基于Hadoop平台、MapReduce以及改进ABC算法的。改进ABC算法用于选择特征,而MapReduce则由并行算法支持,该算法可高效处理大量数据集。该系统使用MapReduce工具实现,并利用粒子滤波来消除噪声。将所提出的算法与同类方法进行比较,并通过使用十个不同的数据集对效率、准确性和吞吐量进行评估。结果表明,相比其他几种较新的算法,提出的算法在选择特征时更具可扩展性和高效性。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-05-24 合作期刊: 《计算机应用研究》
摘要: 目前,通过卫星遥感、低空遥感影像自动,半自动化解译梯田信息有一定的研究进展,但是受数据获取成本、精度、解译方法单一等限制,只限于大面积提取梯田区域。低成本地进行梯田的田面精准提取以及面积统计仍需进一步研究。基于面向对象方法分别对0.5m分辨率的无人机正射影像和地形指数,及两种数据的结合进行梯田区域分割、提取及面积统计。结果表明,将正射影像数据与地形指数结合的梯田的田面提取结果优于基于单一数据源。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-05-20 合作期刊: 《计算机应用研究》
摘要: 传统的生物医学命名实体识别方法需要大量目标领域的标注数据,但是标注数据代价高昂。为了降低生物医学文本中命名实体识别对目标领域标注数据的需求,将生物医学文本中的命名实体识别问题化为基于迁移学习的隐马尔可夫模型问题。对要进行命名实体识别的目标领域数据集无须进行大量数据标注,通过迁移学习的方法实现对目标领域的识别分类。以相关领域数据为辅助数据集,利用数据引力的方法评估辅助数据集的样本在目标领域学习中的贡献程度,在辅助数据集和目标领域数据集上计算权值进行迁移学习。基于权值学习模型,构建基于迁移学习的隐马尔可夫模型算法BioTrHMM。在GENIA语料库的数据集上的实验表明,BioTrHMM算法比传统的隐马尔可夫模型算法具有更好的性能;仅需要少量的目标领域标注数据,即可具有较好的命名实体识别性能。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-04-24 合作期刊: 《计算机应用研究》
摘要: 为充分利用文本内容的上下文信息,结合图模型及查询向量的构建方法,提出一种融合查询内容信息的个性化引文推荐方法。通过三种论文信息构建三层图模型,并在不同层上设置不同参数,调整节点向不同层次的跳转概率;利用word2vec技术构建的查询向量,可以有效利用文本上下文内容信息,使相似的文章在距离上更加接近,进而对候选文章进行评分预测与论文推荐。在Association of Computational Linguistics Anthology Network数据集上进行计算分析,相同查询下与原有的方法相比在recall@N上平均提高约7%,在NDCG@N上平均提高约11%。实验结果表明该方法可以使引文推荐的质量得到有效的提升,能够获得较好的推荐效果。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-04-12 合作期刊: 《计算机应用研究》
摘要: 针对传统侵蚀地形因子提取方法在处理海量数据时出现的瓶颈,提出一种基于MapReduce模型的侵蚀地形因子计算方法。该方法将并行计算模型MapReduce与改进的通用土壤流失方程(revised universal soil loss equation,RUSLE)相结合。利用最大坡降原理和B+树建立流向关系查找树来表现地形数据的相关性;利用MapReduce模型进行流路查找与栅格汇聚来替代传统正反向遍历算法,解决侵蚀地形因子计算过程中汇水和累计坡长的计算效率问题。实验结果表明,对于基于海量数字高程模型数据的地形因子提取,该方法能够在计算精度允许的范围内有效提高效率。