A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Smaller Residual Network for Single Image Depth Estimation Rede residual menor para estimativa de profundidade de imagem única

Andi HENDRA, Yasushi KANAZAWA

  • Exibições de texto completo

    0

  • Cite isto

Resumo:

Propomos uma nova estrutura para estimar informações de profundidade a partir de uma única imagem. Nossa estrutura é relativamente pequena e simples, empregando uma arquitetura de dois estágios: uma rede residual e uma rede decodificadora simples. Nossa rede residual neste artigo é uma remodelação da arquitetura ResNet-50 original, que consiste em apenas trinta e oito camadas de convolução no bloco residual seguidas por um par de duas camadas e amostragem ascendente. Enquanto a rede decodificadora simples, pilha de cinco camadas de convolução, aceita que a profundidade inicial seja refinada como a profundidade de saída final. Durante o treinamento, monitoramos o comportamento de perda e ajustamos o hiperparâmetro da taxa de aprendizagem para melhorar o desempenho. Além disso, em vez de usar uma única perda comum em pixels, também calculamos a perda com base na direção do gradiente e na similaridade de sua estrutura. Essa configuração em nossa rede pode reduzir significativamente o número de parâmetros de rede e, ao mesmo tempo, obter um mapa de profundidade de imagem mais preciso. O desempenho da nossa abordagem foi avaliado através da realização de comparações quantitativas e qualitativas com vários métodos anteriores relacionados nos conjuntos de dados públicos da NYU e KITTI.

Publicação
IEICE TRANSACTIONS on Information Vol.E104-D No.11 pp.1992-2001
Data de publicação
2021/11/01
Publicitada
2021/08/17
ISSN online
1745-1361
DOI
10.1587/transinf.2021EDP7076
Tipo de Manuscrito
PAPER
Categoria
Reconhecimento de imagem, visão computacional

autores

Andi HENDRA
  Toyohashi University of Technology
Yasushi KANAZAWA
  Toyohashi University of Technology

Palavra-chave