A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Multi-Task Learning for Improved Recognition of Multiple Types of Acoustic Information Aprendizagem multitarefa para melhor reconhecimento de vários tipos de informações acústicas

Jae-Won KIM, Hochong PARK

  • Exibições de texto completo

    0

  • Cite isto

Resumo:

Propomos um novo método para melhorar o desempenho de reconhecimento de fonemas, emoções de fala e gêneros musicais usando aprendizagem multitarefa. Quando as tarefas estão intimamente relacionadas, o aprendizado multitarefa pode melhorar o desempenho de cada tarefa, aprendendo a representação de recursos comuns para todas as tarefas. Contudo, as tarefas de reconhecimento consideradas neste estudo exigem diferentes sinais de entrada de fala e música em diferentes escalas de tempo, resultando em recursos de entrada com características diferentes. Além disso, não está disponível um conjunto de dados de treinamento com vários rótulos para todas as fontes de informação. Considerando essas questões, conduzimos o aprendizado multitarefa em um processo de treinamento sequencial usando recursos de entrada com um único rótulo para uma fonte de informação. Uma avaliação comparativa confirma que o método proposto para a aprendizagem multitarefa proporciona maior desempenho para todas as tarefas de reconhecimento do que a aprendizagem individual para cada tarefa, como nos métodos convencionais.

Publicação
IEICE TRANSACTIONS on Information Vol.E104-D No.10 pp.1762-1765
Data de publicação
2021/10/01
Publicitada
2021/07/14
ISSN online
1745-1361
DOI
10.1587/transinf.2021EDL8029
Tipo de Manuscrito
LETTER
Categoria
Fala e Audição

autores

Jae-Won KIM
  Kwangwoon University
Hochong PARK
  Kwangwoon University

Palavra-chave