A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Dynamic Attentive Convolution for Facial Beauty Prediction Convolução Atenta Dinâmica para Predição da Beleza Facial

Zhishu SUN, Zilong XIAO, Yuanlong YU, Luojun LIN

  • Exibições de texto completo

    0

  • Cite isto

Resumo:

A Predição da Beleza Facial (FBP) é uma tarefa significativa de reconhecimento de padrões que visa alcançar uma avaliação consistente da atratividade facial com a percepção humana. Atualmente, Redes Neurais Convolucionais (CNNs) se tornaram o método principal para FBP. O objetivo de treinamento da maioria das CNNs convencionais é geralmente aprender núcleos de convolução estáticos, o que, no entanto, torna a rede bastante difícil de capturar informações de atenção global e, portanto, geralmente ignora as principais regiões faciais, por exemplo, olhos e nariz. Para resolver este problema, desenvolvemos uma nova maneira de convolução, Convolução Atenta Dinâmica (DyAttenConv), que integra o mecanismo de dinâmica e atenção na convolução em nível de kernel, com o objetivo de impor dinamicamente os kernels de convolução adaptados a cada face. DyAttenConv é um módulo plug-and-play que pode ser combinado de forma flexível com as arquiteturas CNN existentes, tornando a aquisição de recursos relacionados à beleza de forma mais global e cuidadosa. Extensos estudos de ablação mostram que nosso método é superior a outros mecanismos de fusão e atenção, e a comparação com outros estados da arte também demonstra a eficácia do DyAttenConv na tarefa de previsão da beleza facial.

Publicação
IEICE TRANSACTIONS on Information Vol.E107-D No.2 pp.239-243
Data de publicação
2024/02/01
Publicitada
2023/11/07
ISSN online
1745-1361
DOI
10.1587/transinf.2023EDL8058
Tipo de Manuscrito
LETTER
Categoria
Reconhecimento de imagem, visão computacional

autores

Zhishu SUN
  Fuzhou University
Zilong XIAO
  Fuzhou University
Yuanlong YU
  Fuzhou University
Luojun LIN
  Fuzhou University

Palavra-chave