A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Learning Local Similarity with Spatial Interrelations on Content-Based Image Retrieval Aprendendo similaridade local com inter-relações espaciais na recuperação de imagens baseada em conteúdo

Longjiao ZHAO, Yu WANG, Jien KATO, Yoshiharu ISHIKAWA

  • Exibições de texto completo

    3

  • Cite isto

Resumo:

Redes Neurais Convolucionais (CNNs) demonstraram recentemente excelente desempenho em tarefas de recuperação de imagens. Características convolucionais locais extraídas por CNNs, em particular, mostram capacidade excepcional de discriminação. Pesquisas recentes neste campo concentraram-se em métodos de agrupamento que incorporam características locais em características globais e avaliam a similaridade global de duas imagens. No entanto, os métodos de agrupamento sacrificam as informações da região local da imagem e as relações espaciais, que são precisamente conhecidas como as chaves para a robustez contra a oclusão e mudanças de ponto de vista. Neste artigo, em vez de métodos de agrupamento, propomos um método alternativo baseado na similaridade local, determinada pelo uso direto de características convolucionais locais. Especificamente, primeiro definimos três formas de tensores de similaridade local (LSTs), que levam em consideração informações sobre regiões locais, bem como relações espaciais entre elas. Em seguida, construímos um modelo CNN de similaridade (SCNN) baseado em LSTs para avaliar a similaridade entre a consulta e as imagens da galeria. A configuração ideal do nosso método é buscada através de experimentos minuciosos sob três perspectivas: tamanho da região local, conteúdo da região local e relações espaciais entre regiões locais. Os resultados experimentais em um conjunto de dados aberto modificado (onde as imagens de consulta são limitadas às ocluídas) confirmam que o método proposto supera os métodos de pooling devido ao aprimoramento da robustez. Além disso, testes em três conjuntos de dados de recuperação públicos mostram que a combinação de LSTs com métodos convencionais de agrupamento alcança os melhores resultados.

Publicação
IEICE TRANSACTIONS on Information Vol.E106-D No.5 pp.1069-1080
Data de publicação
2023/05/01
Publicitada
2023/02/14
ISSN online
1745-1361
DOI
10.1587/transinf.2022EDP7163
Tipo de Manuscrito
PAPER
Categoria
Processamento de imagem e processamento de vídeo

autores

Longjiao ZHAO
  Nagoya University
Yu WANG
  Hitotsubashi University
Jien KATO
  Ritsumeikan University
Yoshiharu ISHIKAWA
  Nagoya University

Palavra-chave