A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Statistical Modelling of Speech Segment Duration by Constrained Tree Regression Modelagem estatística da duração do segmento de fala por regressão de árvore restrita

Naoto IWAHASHI, Yoshinori SAGISAKA

  • Exibições de texto completo

    0

  • Cite isto

Resumo:

Este artigo apresenta um novo método para modelagem estatística de controle de prosódia em síntese de fala. O método proposto, conhecido como Regressão em Árvore Restrita (CTR), pode fazer uma representação adequada de efeitos complexos de fatores de controle para prosódia com uma quantidade moderada de dados de aprendizagem. Baseia-se em divisões recursivas de espaços de variáveis ​​preditoras e imposição parcial de restrições de independência linear entre variáveis ​​preditoras. Ele incorpora regressões lineares e em árvore com variáveis ​​preditoras categóricas, que têm sido convencionalmente usadas para controle de prosódia, e as estende a modelos mais gerais. Além disso, é apresentada uma função de erro hierárquica para considerar a estrutura hierárquica no controle da prosódia. Este novo método é aplicado à modelagem da duração segmentar da fala. Resultados experimentais mostram que melhores modelos de duração são obtidos usando o método de regressão proposto em comparação com regressões lineares e em árvore usando o mesmo número de parâmetros livres. Também é mostrado que a estrutura hierárquica das durações dos fonemas e das sílabas pode ser representada de forma eficiente usando a função de erro hierárquico.

Publicação
IEICE TRANSACTIONS on Information Vol.E83-D No.7 pp.1550-1559
Data de publicação
2000/07/25
Publicitada
ISSN online
DOI
Tipo de Manuscrito
PAPER
Categoria
Fala e Audição

autores

Palavra-chave