分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2019-01-28 合作期刊: 《计算机应用研究》
摘要: 在自动驾驶领域涉及的众多任务中,行人识别是必须可少的技术之一。针对基于图像数据的行人检测算法无法获得行人深度的问题,提出了基于激光雷达数据的行人检测算法。该算法结合传统的基于激光雷达数据的运动目标识别算法和基于深度学习的点云识别算法,可以在不依赖图像数据的条件下感知和检测行人,进而获取行人的准确三维位置,辅助自动驾驶的控制系统作出合理决策。该算法在KITTI三维目标检测任务数据集上进行性能测试,在中等难度测试达到33.37%的平均准确度,其表现领先于其他的基于激光雷达的算法,充分证明了该方法的有效性。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-06-19 合作期刊: 《计算机应用研究》
摘要: 针对背景复杂或者存在字符黏连时文本段图片无法准确切分的情况进行了研究,提出了一种复杂场景文本段识别方法。该方法利用图像和文字序列的相关性设计双向递归神经网络对图像特征序列进行编码,然后设计集成的连接时间分类(CTC)和注意力(attention)模块对编码特征进行解码输出。该算法在多个数据集(公开数据集ICDAR2013和ICDAR2003以及验证码数据集)上进行测试,得到识别准确率分别为90.2%,87.4%和92.5%,从而证明了该算法的有效性。实验结果对文本段识别和应用有重要意义。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-05-24 合作期刊: 《计算机应用研究》
摘要: 针对CT图像的肺结节自动检测任务中检测灵敏度低及存在大量假阳性的问题,提出了一个基于混合损失的三维全卷积网络与基于注意力的多尺度三维残差网络相结合的肺结节检测方法。首先,基于相似度损失预训练三维全卷积网络,利用该网络筛选难例样本,并基于混合损失将难例与正样本进行联合调优得到候选结节检测网络,用于快速筛选疑似结节;然后,利用基于注意力的多尺度三维残差卷积网络对疑似结节进行分类,从候选结节中精确地分辨出真正结节。在LUN16数据集上,候选结节检测阶段的灵敏度在每个病例的假阳数目为59.1时达到97.18%,检测系统的平均灵敏度为0.880,表明本算法可以提高肺结节检测的灵敏度并有效控制假阳性,在LUNA16数据集上获得了更优的性能。