A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Effective Acoustic Modeling for Pronunciation Quality Scoring of Strongly Accented Mandarin Speech Modelagem acústica eficaz para pontuação de qualidade de pronúncia de fala mandarim com forte sotaque

Fengpei GE, Changliang LIU, Jian SHAO, Fuping PAN, Bin DONG, Yonghong YAN

  • Exibições de texto completo

    0

  • Cite isto

Resumo:

Neste artigo apresentamos nossa investigação para melhorar o desempenho de nosso sistema de aprendizagem de línguas assistido por computador (CALL) através da exploração do modelo acústico e dos recursos dentro da estrutura de reconhecimento de fala. Primeiro, para aliviar a distorção do canal, a normalização média do cepstro dependente do alto-falante (CMN) é adotada e o coeficiente de correlação médio (CC médio) entre as pontuações da máquina e do especialista é melhorado de 78.00% para 84.14%. Em segundo lugar, a análise discriminante linear heterocedástica (HLDA) é adotada para aumentar a discriminabilidade do modelo acústico, o que aumenta com sucesso o CC médio de 84.14% para 84.62%. Além disso, o HLDA faz com que a precisão da pontuação seja mais estável em vários níveis de proficiência de pronúncia e, assim, leva a um aumento na taxa de classificação correta do falante de 85.59% para 90.99%. Finalmente, usamos a estimativa máxima a posteriori (MAP) para ajustar o modelo acústico para ajustar a fala de teste com forte sotaque. Como resultado, o CC médio melhorou de 84.62% ​​para 86.57%. Essas três novas técnicas melhoram a precisão da avaliação da qualidade da pronúncia.

Publicação
IEICE TRANSACTIONS on Information Vol.E91-D No.10 pp.2485-2492
Data de publicação
2008/10/01
Publicitada
ISSN online
1745-1361
DOI
10.1093/ietisy/e91-d.10.2485
Tipo de Manuscrito
PAPER
Categoria
Fala e Audição

autores

Palavra-chave