A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

End-to-End Multilingual Speech Recognition System with Language Supervision Training Sistema completo de reconhecimento de fala multilíngue com treinamento de supervisão de idioma

Danyang LIU, Ji XU, Pengyuan ZHANG

  • Exibições de texto completo

    0

  • Cite isto

Resumo:

Os sistemas de reconhecimento automático de fala (ASR) multilíngue ponta a ponta (E2E) visam reconhecer falas multilíngues em uma estrutura unificada. Na atual estrutura ASR multilíngue E2E, a previsão de saída para um idioma específico não possui restrições no escopo de saída das unidades de modelagem. Neste artigo, uma estratégia de treinamento de supervisão de linguagem é proposta com máscaras de linguagem para restringir a distribuição de saída da rede neural. Para simular o cenário ASR multilíngue com informações de identidade de idioma desconhecidas, um classificador de identificação de idioma (LID) é aplicado para estimar as máscaras de idioma. Em quatro corpora de Babel, o sistema ASR multilíngue E2E proposto alcançou uma redução média da taxa absoluta de erros de palavras (WER) de 2.6% em comparação com o sistema de linha de base multilíngue.

Publicação
IEICE TRANSACTIONS on Information Vol.E103-D No.6 pp.1427-1430
Data de publicação
2020/06/01
Publicitada
2020/03/19
ISSN online
1745-1361
DOI
10.1587/transinf.2019EDL8214
Tipo de Manuscrito
LETTER
Categoria
Fala e Audição

autores

Danyang LIU
  Chinese Academy of Sciences,University of Chinese Academy of Sciences
Ji XU
  Chinese Academy of Sciences,University of Chinese Academy of Sciences
Pengyuan ZHANG
  Chinese Academy of Sciences,University of Chinese Academy of Sciences

Palavra-chave