A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Syntax-Based Context Representation for Statistical Machine Translation Representação de contexto baseada em sintaxe para tradução automática estatística

Kehai CHEN, Tiejun ZHAO, Muyun YANG

  • Exibições de texto completo

    0

  • Cite isto

Resumo:

Aprender a representação semântica para o contexto de tradução é benéfico para a tradução automática estatística (SMT). Esforços anteriores concentraram-se na codificação implícita do conhecimento sintático e semântico no contexto da tradução por redes neurais, que são fracas na captura de informações de sintaxe estrutural explícita. Neste artigo, propomos uma nova rede neural com uma arquitetura convolucional baseada em árvore para aprender explicitamente informações de sintaxe estrutural no contexto de tradução, melhorando assim a previsão da tradução. Especificamente, primeiro convertemos sentenças paralelas com árvores de análise de origem em sequências lineares baseadas em sintaxe com base em um algoritmo de subárvore de sintaxe mínima e, em seguida, definimos uma rede convolucional baseada em árvore sobre as sequências lineares para aprender conjuntamente a representação de contexto baseada em sintaxe e a previsão de tradução. Para verificar a eficácia, o modelo proposto é integrado ao SMT baseado em frases. Experimentos em tarefas de tradução em larga escala de chinês para inglês e alemão para inglês mostram que a abordagem proposta pode alcançar uma melhoria substancial e significativa em vários sistemas de base.

Publicação
IEICE TRANSACTIONS on Information Vol.E101-D No.12 pp.3226-3237
Data de publicação
2018/12/01
Publicitada
2018/08/24
ISSN online
1745-1361
DOI
10.1587/transinf.2018EDP7209
Tipo de Manuscrito
PAPER
Categoria
Processamento de Linguagem Natural

autores

Kehai CHEN
  Harbin Institute of Technology
Tiejun ZHAO
  Harbin Institute of Technology
Muyun YANG
  Harbin Institute of Technology

Palavra-chave