A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Research on Lightweight Acoustic Scene Perception Method Based on Drunkard Methodology Pesquisa sobre método de percepção de cena acústica leve com base na metodologia do bêbado

Wenkai LIU, Lin ZHANG, Menglong WU, Xichang CAI, Hongxia DONG

  • Exibições de texto completo

    0

  • Cite isto

Resumo:

O objetivo da Classificação de Cena Acústica (ASC) é simular a análise humana do ambiente circundante e tomar decisões precisas prontamente. Extrair informações úteis de sinais de áudio em cenários do mundo real é um desafio e pode levar a um desempenho abaixo do ideal na classificação de cenas acústicas, especialmente em ambientes com fundos relativamente homogêneos. Para resolver este problema, modelamos o processo de sobriedade dos “bêbados” na vida real e o comportamento orientador das pessoas normais, e construímos uma metodologia de implementação de modelo leve de alta precisão chamada “metodologia do bêbado”. A ideia central inclui três partes: (1) projetar um módulo especial de transformação de características baseado nos diferentes mecanismos de percepção de informações entre bêbados e pessoas comuns, para simular o processo de sobriedade gradual e as mudanças na capacidade de percepção de características; (2) estudar um modelo leve “bêbado” que corresponda ao processo de processamento de percepção do modelo normal. O modelo usa uma estrutura de bloco residual de classe multiescala e pode obter representações de recursos mais refinadas ao fundir informações extraídas em diferentes escalas; (3) introdução de um módulo de orientação e fusão do modelo convencional ao modelo “bêbado” para acelerar o processo de recuperação e alcançar otimização iterativa e melhoria de precisão. Os resultados da avaliação no conjunto de dados oficial do DCASE2022 Task1 demonstram que nosso sistema de linha de base atinge 40.4% de precisão e 2.284 perdas sob a condição de parâmetros de 442.67K e 19.40M MAC (operações de multiplicação e acumulação). Após adotar o mecanismo “bêbado”, a precisão é melhorada para 45.2% e a perda é reduzida em 0.634 sob a condição de parâmetros de 551.89K e 23.6M MAC.

Publicação
IEICE TRANSACTIONS on Information Vol.E107-D No.1 pp.83-92
Data de publicação
2024/01/01
Publicitada
2023/10/23
ISSN online
1745-1361
DOI
10.1587/transinf.2023EDP7107
Tipo de Manuscrito
PAPER
Categoria
Inteligência Artificial, Mineração de Dados

autores

Wenkai LIU
  North China University of Technology
Lin ZHANG
  North China University of Technology
Menglong WU
  North China University of Technology
Xichang CAI
  North China University of Technology
Hongxia DONG
  North China University of Technology

Palavra-chave