A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Acoustic Feature Transformation Based on Discriminant Analysis Preserving Local Structure for Speech Recognition Transformação de características acústicas baseada em análise discriminante, preservando a estrutura local para reconhecimento de fala

Makoto SAKAI, Norihide KITAOKA, Kazuya TAKEDA

  • Exibições de texto completo

    0

  • Cite isto

Resumo:

Para melhorar o desempenho do reconhecimento de fala, a transformação de recursos baseada na análise discriminante tem sido amplamente utilizada para reduzir as dimensões redundantes dos recursos acústicos. A análise discriminante linear (LDA) e a análise discriminante heterocedástica (HDA) são frequentemente utilizadas para esse fim, e um método de generalização para LDA e HDA, denominado power LDA (PLDA), foi proposto. No entanto, estes métodos podem resultar numa redução inesperada da dimensionalidade dos dados multimodais. É importante preservar a estrutura local dos dados ao reduzir a dimensionalidade dos dados multimodais. Neste artigo, apresentamos dois métodos, HDA com preservação de localidade e PLDA com preservação de localidade, para reduzir adequadamente a dimensionalidade dos dados multimodais. Também propomos um esquema de cálculo aproximado para calcular rapidamente projeções subótimas. Resultados experimentais mostram que os métodos de preservação de localidade apresentam melhor desempenho que os tradicionais no reconhecimento de fala.

Publicação
IEICE TRANSACTIONS on Information Vol.E93-D No.5 pp.1244-1252
Data de publicação
2010/05/01
Publicitada
ISSN online
1745-1361
DOI
10.1587/transinf.E93.D.1244
Tipo de Manuscrito
PAPER
Categoria
Fala e Audição

autores

Palavra-chave