加急见刊

基于多并行计算和存储的CNN加速器

李宗凌; 汪路元; 禹霁阳; 程博文; 郝梁; 张伟功 北京空间飞行器总体设计部; 北京100094; 首都师范大学信息工程学院; 北京100048

摘要:根据深度卷积神经网络(CNN)前向推理结构特点,设计了基于多并行计算和存储的深度卷积神经网络加速器,从运算效率与数据重用两个角度分析了卷积运算的并行特征,并研究了全连接层的全并行流水实现方式。该加速器采用并行流水结构提升计算效率,在卷积层运算中,充分利用多种卷积运算并行架构平衡运算效率与参数及数据载入带宽的需求,通过三种加速方式实现卷积层内全流水加速;在全连接层运算中,将乘累加运算设计成全流水处理架构,流水延时不超过20个处理时钟,并通过并行计算实现16倍加速。在基于ImageNet公开数据集验证实验中,该加速器每周期最多运行2304次乘累加运算,在150MHz的工作频率下,峰值运算速率达到691.2Gops,能效比为i7-6700-CPU的2700倍以上,为GTX-1050-GPU的290倍以上。该加速器在硬件资源、计算精度、速度以及功耗等多方面达到良好平衡,便于在星载嵌入式环境应用。

注: 保护知识产权,如需阅读全文请联系计算机技术与发展杂志社