A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Blind Bandwidth Extension with a Non-Linear Function and Its Evaluation on Automatic Speaker Verification Extensão cega de largura de banda com função não linear e sua avaliação na verificação automática de alto-falantes

Ryota KAMINISHI, Haruna MIYAMOTO, Sayaka SHIOTA, Hitoshi KIYA

  • Exibições de texto completo

    0

  • Cite isto

Resumo:

Este estudo avalia os efeitos de alguns métodos de extensão cega de largura de banda (BWE) sem aprendizagem em sistemas de verificação automática de alto-falante (ASV) de última geração. Recentemente, um método de extensão de largura de banda não linear (N-BWE) foi proposto como uma abordagem BWE cega, sem aprendizagem e leve. Outros BWEs não relacionados à aprendizagem também foram desenvolvidos nos últimos anos. Para avaliações ASV, a maioria dos dados disponíveis para treinar sistemas ASV são fala telefônica em banda estreita (NB). Enquanto isso, dados de banda larga (WB) têm sido usados ​​para treinar os sistemas ASV de última geração, como i-vector, d-vector e x-vector. Isso pode causar incompatibilidades na taxa de amostragem quando todos os conjuntos de dados são usados. Neste artigo, investigamos a influência das incompatibilidades de taxas de amostragem nos sistemas ASV baseados em vetores x e como os métodos BWE de não aprendizagem funcionam contra eles. Os resultados mostraram que o método N-BWE melhorou a taxa de erro igual (EER) em sistemas ASV com base no vetor x quando as incompatibilidades estavam presentes. Pesquisamos a relação entre medidas objetivas e EERs. Consequentemente, o método N-BWE produziu os EERs mais baixos em ambos os sistemas ASV e obteve o menor valor RMS-LSD e o maior escore STOI.

Publicação
IEICE TRANSACTIONS on Information Vol.E103-D No.1 pp.42-49
Data de publicação
2020/01/01
Publicitada
2019/10/25
ISSN online
1745-1361
DOI
10.1587/transinf.2019MUP0008
Tipo de Manuscrito
Special Section PAPER (Special Section on Enriched Multimedia — Application of Multimedia Technology and Its Security —)
Categoria

autores

Ryota KAMINISHI
  Tokyo Metropolitan University
Haruna MIYAMOTO
  Tokyo Metropolitan University
Sayaka SHIOTA
  Tokyo Metropolitan University
Hitoshi KIYA
  Tokyo Metropolitan University

Palavra-chave