A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Recognition of Collocation Frames from Sentences Reconhecimento de quadros de colocação de sentenças

Xiaoxia LIU, Degen HUANG, Zhangzhi YIN, Fuji REN

  • Exibições de texto completo

    0

  • Cite isto

Resumo:

A colocação é um fenômeno onipresente em idiomas e o reconhecimento e extração precisos da colocação são de grande importância para muitas tarefas de processamento de linguagem natural. As colocações podem ser diferenciadas de colocações simples de bigramas até quadros de colocação (referindo-se a colocações multigramas distantes). Até agora, pouco foco foi dado aos quadros de colocação. Orientado para tradução e análise, este estudo visa reconhecer e extrair os quadros de colocação mais longos possíveis de determinadas sentenças. Primeiro extraímos colocações de bigramas com método baseado em semântica distributiva, introduzindo padrões de colocação e integrando algumas medidas de associação de última geração. Com base nas colocações de bigramas extraídas pelo método proposto, obtemos os quadros de colocação mais longos de acordo com a natureza recursiva e as regras linguísticas das colocações. Comparado com os sistemas de linha de base, o método proposto tem um desempenho significativamente melhor na extração de colocação de bigramas, tanto em precisão quanto em recuperação. E na extração de quadros de colocação, o método proposto tem um desempenho ainda melhor com precisão semelhante aos resultados de extração de colocação de bigramas.

Publicação
IEICE TRANSACTIONS on Information Vol.E102-D No.3 pp.620-627
Data de publicação
2019/03/01
Publicitada
2018/12/14
ISSN online
1745-1361
DOI
10.1587/transinf.2018EDP7255
Tipo de Manuscrito
PAPER
Categoria
Processamento de Linguagem Natural

autores

Xiaoxia LIU
  Dalian University of Technology
Degen HUANG
  Dalian University of Technology
Zhangzhi YIN
  Dalian University of Technology
Fuji REN
  Tokushima University

Palavra-chave