Chrome Extension
WeChat Mini Program
Use on ChatGLM

基于多并行计算和存储的CNN加速器

Computer Technology and Development(2019)

Cited 0|Views6
No score
Abstract
根据深度卷积神经网络(CNN)前向推理结构特点,设计了基于多并行计算和存储的深度卷积神经网络加速器,从运算效率与数据重用两个角度分析了卷积运算的并行特征,并研究了全连接层的全并行流水实现方式.该加速器采用并行流水结构提升计算效率,在卷积层运算中,充分利用多种卷积运算并行架构平衡运算效率与参数及数据载入带宽的需求,通过三种加速方式实现卷积层内全流水加速;在全连接层运算中,将乘累加运算设计成全流水处理架构,流水延时不超过20个处理时钟,并通过并行计算实现16倍加速.在基于ImageNet公开数据集验证实验中,该加速器每周期最多运行2304次乘累加运算,在150 MHz的工作频率下,峰值运算速率达到691.2 Gops,能效比为i7-6700-CPU的2700倍以上,为GTX-1050-GPU的290倍以上.该加速器在硬件资源、计算精度、速度以及功耗等多方面达到良好平衡,便于在星载嵌入式环境应用.
More
AI Read Science
Must-Reading Tree
Example
Generate MRT to find the research sequence of this paper
Chat Paper
Summary is being generated by the instructions you defined