A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

FCA-BNN: Flexible and Configurable Accelerator for Binarized Neural Networks on FPGA FCA-BNN: acelerador flexível e configurável para redes neurais binarizadas em FPGA

Jiabao GAO, Yuchen YAO, Zhengjie LI, Jinmei LAI

  • Exibições de texto completo

    0

  • Cite isto

Resumo:

Uma série de redes neurais binarizadas (BNNs) mostram a precisão aceita em tarefas de classificação de imagens e alcançam excelente desempenho em field programmable gate array (FPGA). No entanto, observamos que os projetos existentes de BNNs consomem bastante tempo na mudança do BNN alvo e na aceleração de um novo BNN. Portanto, este artigo apresenta o FCA-BNN, um acelerador flexível e configurável, que emprega a técnica configurável em nível de camada para executar perfeitamente cada camada do BNN alvo. Inicialmente, para economizar recursos e melhorar a eficiência energética, as fórmulas ideais orientadas a hardware são introduzidas para projetar matrizes de computação com eficiência energética para diferentes tamanhos de convolução acolchoada e camadas totalmente conectadas. Além disso, para acelerar os BNNs alvo de forma eficiente, exploramos o modelo analítico para explorar os parâmetros de projeto ideais para FCA-BNN. Finalmente, nosso fluxo de mapeamento proposto altera a rede alvo inserindo ordem e acelera uma nova rede compilando e carregando instruções correspondentes, sem carregar e gerar fluxo de bits. As avaliações em três estruturas principais de BNNs mostram que as diferenças entre a precisão de inferência do FCA-BNN e a da GPU são de apenas 0.07%, 0.31% e 0.4% para LFC, VGG-like e Cifar-10 AlexNet. Além disso, nossos resultados de eficiência energética alcançam os resultados dos aceleradores FPGA personalizados existentes em 0.8× para LFC e 2.6× para tipo VGG. Para o Cifar-10 AlexNet, o FCA-BNN alcança 188.2× e 60.6× melhor que CPU e GPU em eficiência energética, respectivamente. Até onde sabemos, FCA-BNN é o projeto mais eficiente para mudança do BNN alvo e aceleração de um novo BNN, ao mesmo tempo que mantém o desempenho competitivo.

Publicação
IEICE TRANSACTIONS on Information Vol.E104-D No.8 pp.1367-1377
Data de publicação
2021/08/01
Publicitada
2021/05/19
ISSN online
1745-1361
DOI
10.1587/transinf.2021EDP7054
Tipo de Manuscrito
PAPER
Categoria
Biocibernética, Neurocomputação

autores

Jiabao GAO
  Fudan University
Yuchen YAO
  Fudan University
Zhengjie LI
  Fudan University
Jinmei LAI
  Fudan University

Palavra-chave