A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Speech Enhancement: New Approaches to Soft Decision Aprimoramento da fala: novas abordagens para decisões suaves

Joon-Hyuk CHANG, Nam Soo KIM

  • Exibições de texto completo

    2

  • Cite isto

Resumo:

Neste artigo, propomos novas abordagens para o aprimoramento da fala com base na decisão suave. A fim de aumentar a confiabilidade estatística na estimativa da atividade de fala, introduzimos o conceito de probabilidade global de ausência de fala (GSAP). Primeiro, calculamos a probabilidade de ausência de fala convencional (SAP) e depois a modificamos de acordo com o GSAP recentemente proposto. A modificação é feita de forma que o SAP tenha o mesmo valor do GSAP no caso de ausência de fala e seja mantido em seu valor original quando a fala estiver presente. Além disso, para melhorar o desempenho dos SAP's nas caudas de voz (períodos de transição da fala para o silêncio), revisamos os SAP's usando um esquema de ressaca baseado no modelo oculto de Markov (HMM). Além disso, sugerimos um algoritmo robusto de atualização de ruído no qual a potência do ruído é estimada não apenas nos períodos de ausência de fala, mas também durante a atividade de fala com base na decisão suave. Além disso, para melhorar as rotinas de determinação SAP e atualização de ruído, apresentamos um novo conceito de relação sinal-ruído (SNR), que é chamado de SNR previsto neste artigo. Além disso, demonstramos que a transformada discreta de cosseno (DCT) aumenta a precisão da estimativa SAP. Vários testes mostram que o método proposto, denominado algoritmo de aprimoramento de fala baseado em decisão suave (SESD), produz melhor desempenho do que as abordagens convencionais.

Publicação
IEICE TRANSACTIONS on Information Vol.E84-D No.9 pp.1231-1240
Data de publicação
2001/09/01
Publicitada
ISSN online
DOI
Tipo de Manuscrito
PAPER
Categoria
Fala e Audição

autores

Palavra-chave