A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Vector Quantization of High-Dimensional Speech Spectra Using Deep Neural Network Quantização vetorial de espectros de fala de alta dimensão usando rede neural profunda

JianFeng WU, HuiBin QIN, YongZhu HUA, LiHuan SHAO, Ji HU, ShengYing YANG

  • Exibições de texto completo

    0

  • Cite isto

Resumo:

Este artigo propõe uma estrutura baseada em rede neural profunda (DNN) para resolver o problema de quantização vetorial (VQ) para dados de alta dimensão. O principal desafio da aplicação de DNN ao VQ é como reduzir o erro de codificação binária do autocodificador quando a distribuição das unidades de codificação está longe de ser binária. Para resolver este problema, três métodos de ajuste fino foram adotados: 1) adicionar ruído gaussiano à entrada da camada de codificação, 2) forçar a saída da camada de codificação a ser binária, 3) adicionar um termo de penalidade não binário para a função de perda. Esses métodos de ajuste fino foram extensivamente avaliados na quantização de espectros de magnitude de fala. Os resultados demonstraram que cada um dos métodos é útil para melhorar o desempenho da codificação. Quando implementada para quantizar espectros de fala de 968 dimensões usando apenas 18 bits, a estrutura VQ baseada em DNN alcançou um PESQ médio de cerca de 2.09, que está muito além da capacidade dos métodos VQ convencionais.

Publicação
IEICE TRANSACTIONS on Information Vol.E102-D No.10 pp.2047-2050
Data de publicação
2019/10/01
Publicitada
2019/07/02
ISSN online
1745-1361
DOI
10.1587/transinf.2019EDL8023
Tipo de Manuscrito
LETTER
Categoria
Inteligência Artificial, Mineração de Dados

autores

JianFeng WU
  Hangzhou Dianzi University
HuiBin QIN
  Hangzhou Dianzi University
YongZhu HUA
  Hangzhou Dianzi University
LiHuan SHAO
  Hangzhou Dianzi University
Ji HU
  Hangzhou Dianzi University
ShengYing YANG
  Hangzhou Dianzi University

Palavra-chave