A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

RNA: An Accurate Residual Network Accelerator for Quantized and Reconstructed Deep Neural Networks RNA: um acelerador de rede residual preciso para redes neurais profundas quantizadas e reconstruídas

Cheng LUO, Wei CAO, Lingli WANG, Philip H. W. LEONG

  • Exibições de texto completo

    0

  • Cite isto

Resumo:

Com o refinamento contínuo das Redes Neurais Profundas (DNNs), uma série de redes profundas e complexas, como as Redes Residuais (ResNets), mostram uma precisão de previsão impressionante em tarefas de classificação de imagens. Infelizmente, a complexidade estrutural e o custo computacional das redes residuais dificultam a implementação do hardware. Neste artigo, apresentamos a técnica de rede neural profunda quantizada e reconstruída (QR-DNN), que primeiro insere camadas de normalização de lote (BN) na rede durante o treinamento e depois as remove para facilitar a implementação eficiente de hardware. Além disso, um acelerador de rede residual (RNA) preciso e eficiente é apresentado baseado em QR-DNN com estruturas e pesos livres de normalização de lote representados em um sistema numérico logarítmico. O RNA emprega uma arquitetura de matriz sistólica para realizar operações de deslocamento e acumulação em vez de operações de multiplicação. Foi demonstrado que o QR-DNN alcança uma melhoria de 1 a 2% na precisão em relação às técnicas existentes e o RNA em relação aos melhores aceleradores de ponto fixo anteriores. Uma implementação FPGA em um dispositivo Xilinx Zynq XC7Z045 atinge 804.03 GOPS, 104.15 FPS e 91.41% de precisão top-5 para o benchmark ResNet-50, e resultados de última geração também são relatados para AlexNet e VGG.

Publicação
IEICE TRANSACTIONS on Information Vol.E102-D No.5 pp.1037-1045
Data de publicação
2019/05/01
Publicitada
2019/02/19
ISSN online
1745-1361
DOI
10.1587/transinf.2018RCP0008
Tipo de Manuscrito
Special Section PAPER (Special Section on Reconfigurable Systems)
Categoria
Aplicações

autores

Cheng LUO
  Fudan University
Wei CAO
  Fudan University
Lingli WANG
  Fudan University
Philip H. W. LEONG
  University of Sydney

Palavra-chave