您选择的条件: 卢冶
  • 面向云端FPGA的卷积神经网络加速器的设计及其调度

    分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-11-29 合作期刊: 《计算机应用研究》

    摘要: 卷积神经网络的高计算复杂性阻碍其广泛用于实时和低功耗应用,现有软件实现方案难以满足卷积神经网络对运算性能与功耗的要求,传统面向FPGA的卷积神经网络构造方式具有流程复杂、周期较长和优化空间较小等问题。针对该问题,根据卷积神经网络计算模式的特点,提出一种面向云端FPGA的卷积神经网络加速器的设计及其调度机制。通过借鉴基于HLS技术、引入循环切割参数和对卷积层循环重排的设计,采用模块化方式构造网络,并进行参数拓展以进一步优化加速器处理过程;通过分析系统任务和资源的特性总结调度方案,且从控制流和数据流两方面对其进行优化设计。与其他已有工作相比,所提出的设计提供了一种同时具有灵活性,低能耗、高能效和高性能的解决方案,并且探讨了加速器的高效通用调度方案。实验结果表明,与CPU实现相比,该设计实现AlexNet达到8.48倍的加速,而实现Cifar的功耗仅为其24.96%;相较于CPU+GPU实现对Cifar6.90倍的加速比,虽然实现较大规模网络的性能不及GPU,但功耗最小仅为其14.98%;与已有研究成果相比,最大达到6.29倍的加速比。其中与大平台生成的加速器相比,即使仅达到相当的性能,但具有更低的时钟频率。