A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Constant-Q Deep Coefficients for Playback Attack Detection Coeficientes profundos Constant-Q para detecção de ataques de reprodução

Jichen YANG, Longting XU, Bo REN

  • Exibições de texto completo

    0

  • Cite isto

Resumo:

No âmbito da extração de recursos tradicional baseada no espectro de potência, a fim de extrair informações mais discriminativas para detecção de ataques de reprodução, este artigo propõe um recurso que faz uso de rede neural profunda para descrever a relação não linear entre o espectro de potência e as informações discriminativas. Ou seja, coeficientes profundos de Q constante (CQDC). Ele se baseia na transformada Q constante, na rede neural profunda e na transformada discreta de cosseno. Em que a transformada Q constante é usada para converter o sinal do domínio do tempo para o domínio da frequência porque é uma transformação de longo prazo que pode fornecer mais detalhes de frequência, a rede neural profunda é usada para extrair mais informações discriminativas para discriminar a fala de reprodução de fala genuína e transformação discreta de cosseno são usadas para descorrelacionar entre as dimensões do recurso. ASVspoof 2017 corpus versão 2.0 é usado para avaliar o desempenho do CQDC. Os resultados experimentais mostram que o CQDC supera o espectro de potência existente obtido a partir de recursos baseados na transformada Q constante, e o erro igual pode ser reduzido de 19.18% para 51.56%. Além disso, descobrimos que as informações discriminativas do CQDC estão ocultas em todos os compartimentos de frequência, o que é diferente dos recursos comumente usados.

Publicação
IEICE TRANSACTIONS on Information Vol.E103-D No.2 pp.464-468
Data de publicação
2020/02/01
Publicitada
2019/11/14
ISSN online
1745-1361
DOI
10.1587/transinf.2019EDL8115
Tipo de Manuscrito
LETTER
Categoria
Fala e Audição

autores

Jichen YANG
  National University of Singapore
Longting XU
  Donghua University
Bo REN
   Microsoft Search Technology Center Asia

Palavra-chave