A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Discriminating Semantic Visual Words for Scene Classification Discriminando palavras visuais semânticas para classificação de cenas

Shuoyan LIU, De XU, Songhe FENG

  • Exibições de texto completo

    0

  • Cite isto

Resumo:

A representação Bag-of-Visual-Words tornou-se recentemente popular para classificação de cenas. Porém, aprender as palavras visuais de maneira não supervisionada sofre com o problema quando se depara com essas manchas com aparências semelhantes correspondentes a conceitos semânticos distintos. Este artigo propõe uma nova estrutura de aprendizagem supervisionada, que visa aproveitar ao máximo as informações do rótulo para resolver o problema. Especificamente, a Modelagem de Mistura Gaussiana (GMM) é aplicada primeiramente para obter "interpretação semântica" de patches usando rótulos de cena. Cada cena induz uma densidade de probabilidade no espaço de características visuais de baixo nível, e os patches são representados como vetores de probabilidades de conceitos semânticos da cena posterior. E então o algoritmo Information Bottleneck (IB) é introduzido para agrupar os patches em "palavras visuais" de forma supervisionada, do ponto de vista das interpretações semânticas. Tal operação pode maximizar a informação semântica das palavras visuais. Uma vez obtidas as palavras visuais, a frequência de aparecimento das palavras visuais correspondentes em uma determinada imagem forma um histograma, que pode ser posteriormente utilizado na tarefa de categorização de cena através do classificador Support Vector Machine (SVM). Experimentos em um conjunto de dados desafiador mostram que as palavras visuais propostas executam melhor a tarefa de classificação de cena do que a maioria dos métodos existentes.

Publicação
IEICE TRANSACTIONS on Information Vol.E93-D No.6 pp.1580-1588
Data de publicação
2010/06/01
Publicitada
ISSN online
1745-1361
DOI
10.1587/transinf.E93.D.1580
Tipo de Manuscrito
PAPER
Categoria
Reconhecimento de Padrões

autores

Palavra-chave