基于FPGA的卷积神经网络反向加速设计与实现

SUN Chuanmeng, DENG Huifang, WANG Yanping,XU Ruijia

Transducer and Microsystem Technologies(2023)

引用 0|浏览6
暂无评分
摘要
卷积神经网络(CNN)计算量大,网络训练时间长,借助现场可编程门阵列(FPGA)良好的并行性,可加速其反向网络的参数训练过程,从而加快训练速度.首先,所设计的CNN反向加速网络具有良好的加速性能;然后,设计了CNN的FPGA硬件加速系统和一个加速计算模块,且用Kroneck乘积计算来减少CNN参数和时间复杂度;最后,进行Zedboard纯PS训练和使用反向网络PL加速器训练CNN的对比实验.实验结果表明:基于FPGA CNN的反向加速性能是仅在纯CPU上进行神经网络加速的111.15倍.
更多
关键词
reverse acceleration,convolutional neural network(CNN),field programmable gate array(FPGA),hardware acceleration,Kroneck product
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要