A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

BRsyn-Caps: Chinese Text Classification Using Capsule Network Based on Bert and Dependency Syntax BRsyn-Caps: Classificação de texto chinês usando rede Capsule baseada em Bert e sintaxe de dependência

Jie LUO, Chengwan HE, Hongwei LUO

  • Exibições de texto completo

    0

  • Cite isto

Resumo:

A classificação de texto é uma tarefa fundamental no processamento de linguagem natural, que encontra amplas aplicações em diversos domínios, como detecção de spam e análise de sentimentos. As informações sintáticas podem ser utilizadas de forma eficaz para melhorar o desempenho dos modelos de redes neurais na compreensão da semântica do texto. O texto chinês exibe um alto grau de complexidade sintática, com palavras individuais muitas vezes possuindo múltiplas classes gramaticais. Neste artigo, propomos BRsyn-caps, um modelo de classificação de texto chinês baseado em rede cápsula que aproveita a sintaxe Bert e de dependência. Nossa abordagem proposta integra informações semânticas por meio do modelo de pré-treinamento Bert para obter representações de palavras, extrai informações contextuais por meio de rede neural de memória de longo e curto prazo (LSTM), codifica árvores de dependência sintática por meio de rede neural de atenção gráfica e utiliza rede de cápsula para integrar recursos de maneira eficaz para classificação de texto. Além disso, propomos um algoritmo de construção de matriz de adjacência de árvore de dependência sintática em nível de caractere, que pode introduzir informações sintáticas na representação em nível de caractere. Experimentos em cinco conjuntos de dados demonstram que BRsyn-caps pode integrar efetivamente informações semânticas, sequenciais e sintáticas em texto, comprovando a eficácia de nosso método proposto para classificação de texto chinês.

Publicação
IEICE TRANSACTIONS on Information Vol.E107-D No.2 pp.212-219
Data de publicação
2024/02/01
Publicitada
2023/11/06
ISSN online
1745-1361
DOI
10.1587/transinf.2023EDP7119
Tipo de Manuscrito
PAPER
Categoria
Processamento de Linguagem Natural

autores

Jie LUO
  Wuhan Institute of Technology
Chengwan HE
  Wuhan Institute of Technology
Hongwei LUO
  Wuhan Institute of Technology

Palavra-chave