A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

MCGCN: Multi-Correlation Graph Convolutional Network for Pedestrian Attribute Recognition MCGCN: Rede Convolucional de Gráfico Multicorrelação para Reconhecimento de Atributos de Pedestres

Yang YU, Longlong LIU, Ye ZHU, Shixin CEN, Yang LI

  • Exibições de texto completo

    0

  • Cite isto

Resumo:

O reconhecimento de atributos de pedestres (PAR) visa reconhecer uma série de atributos semânticos de uma pessoa, por exemplo, idade, sexo, o que desempenha um papel importante na videovigilância. Este artigo propõe uma rede convolucional de gráfico multicorrelação denominada MCGCN para PAR, que inclui um gráfico semântico, um gráfico visual e um gráfico de síntese. Construímos um gráfico semântico usando recursos de atributos com restrições semânticas. Uma convolução gráfica é empregada, com base no conhecimento prévio do conjunto de dados, para aprender a correlação semântica. Os recursos 2D são projetados em nós do gráfico visual e cada nó corresponde à região de recursos de cada grupo de atributos. A convolução do gráfico é então utilizada para aprender a correlação regional. Os nós do gráfico visual são conectados aos nós do gráfico semântico para formar um gráfico de síntese. No gráfico de síntese, as correlações regional e semântica são incorporadas entre si por meio de bordas entre gráficos, para orientar o aprendizado de cada um e para atualizar o gráfico visual e semântico, construindo assim a correlação semântica e regional. Nesta base, utilizamos uma melhor estratégia de ponderação de perdas, a suit_polyloss, para resolver o desequilíbrio dos conjuntos de dados de atributos de pedestres. Experimentos em três conjuntos de dados de referência mostram que a abordagem proposta atinge um desempenho de reconhecimento superior em comparação com as tecnologias existentes e atinge um desempenho de última geração.

Publicação
IEICE TRANSACTIONS on Information Vol.E107-D No.3 pp.400-410
Data de publicação
2024/03/01
Publicitada
2023/11/29
ISSN online
1745-1361
DOI
10.1587/transinf.2023EDP7134
Tipo de Manuscrito
PAPER
Categoria
Reconhecimento de imagem, visão computacional

autores

Yang YU
  Hebei University of Technology
Longlong LIU
  Hebei University of Technology
Ye ZHU
  Hebei University of Technology
Shixin CEN
  Tianjin University of Traditional Chinese Medicine
Yang LI
  Tianjin Academy of Agricultural Sciences

Palavra-chave