A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Open Access
Simultaneous Estimation of Dish Locations and Calories with Multi-Task Learning
Abra o Access
Estimativa simultânea de localizações e calorias de pratos com aprendizagem multitarefa

Takumi EGE, Keiji YANAI

  • Exibições de texto completo

    73

  • Cite isto
  • Free PDF (2.6MB)

Resumo:

Nos últimos anos, o aumento da alimentação saudável levou ao surgimento de vários aplicativos de gerenciamento de alimentos que possuem função de reconhecimento de imagem para registrar automaticamente as refeições diárias. No entanto, a maioria das funções de reconhecimento de imagem nos aplicativos existentes não são diretamente úteis para fotos de alimentos com vários pratos e não podem estimar automaticamente as calorias dos alimentos. Enquanto isso, as metodologias de reconhecimento de imagens avançaram muito com o advento da Rede Neural Convolucional (CNN). A CNN melhorou a precisão de vários tipos de tarefas de reconhecimento de imagem, como classificação e detecção de objetos. Portanto, propomos a estimativa de calorias alimentares baseada na CNN para fotos de alimentos com vários pratos. Nosso método estima a localização dos pratos e as calorias dos alimentos simultaneamente, por meio do aprendizado multitarefa de detecção de pratos de alimentos e estimativa de calorias dos alimentos com uma única CNN. Espera-se alcançar alta velocidade e tamanho de rede pequeno por estimativa simultânea em uma única rede. Como atualmente não existe um conjunto de dados de fotos de alimentos de vários pratos anotados com caixas delimitadoras e calorias de alimentos, neste trabalho usamos dois tipos de conjuntos de dados alternadamente para treinar uma única CNN. Para os dois tipos de conjuntos de dados, usamos fotos de alimentos de vários pratos anotadas com caixas delimitadoras e fotos de alimentos de um único prato com calorias alimentares. Nossos resultados mostraram que nosso método multitarefa alcançou maior precisão, maior velocidade e menor tamanho de rede do que um modelo sequencial de detecção de alimentos e estimativa de calorias alimentares.

Publicação
IEICE TRANSACTIONS on Information Vol.E102-D No.7 pp.1240-1246
Data de publicação
2019/07/01
Publicitada
2019/04/25
ISSN online
1745-1361
DOI
10.1587/transinf.2018CEP0004
Tipo de Manuscrito
Special Section PAPER (Special Section on Multimedia for Cooking and Eating Activities)
Categoria

autores

Takumi EGE
  The University of Electro-Communications
Keiji YANAI
  The University of Electro-Communications

Palavra-chave