A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Single-Line Text Detection in Multi-Line Text with Narrow Spacing for Line-Based Character Recognition Detecção de texto de linha única em texto multilinha com espaçamento estreito para reconhecimento de caracteres baseado em linha

Chee Siang LEOW, Hideaki YAJIMA, Tomoki KITAGAWA, Hiromitsu NISHIZAKI

  • Exibições de texto completo

    0

  • Cite isto

Resumo:

A detecção de texto é uma etapa crucial de pré-processamento no reconhecimento óptico de caracteres (OCR) para o reconhecimento preciso de texto, incluindo fontes e caracteres manuscritos, em documentos. Embora as atuais ferramentas de detecção de texto baseadas em aprendizagem profunda possam detectar regiões de texto com alta precisão, elas geralmente tratam múltiplas linhas de texto como uma única região. Para realizar o reconhecimento de caracteres baseado em linhas, é necessário dividir o texto em linhas individuais, o que requer uma técnica de detecção de linhas. Este artigo se concentra no desenvolvimento de uma nova abordagem para detecção de linha única em OCR que é baseada no modelo existente de reconhecimento de região de caracteres para detecção de texto (CRAFT) e incorpora uma rede neural profunda especializada em segmentação de linha. No entanto, este novo método ainda pode detectar múltiplas linhas como uma única região de texto quando estiver presente texto de múltiplas linhas com espaçamento estreito. Para resolver isso, também introduzimos um algoritmo de pós-processamento para detectar regiões de texto único usando a saída da segmentação de linha única. Nosso método proposto detecta com sucesso linhas únicas, mesmo em texto multilinha com espaçamento estreito entre linhas e, portanto, melhora a precisão do OCR.

Publicação
IEICE TRANSACTIONS on Information Vol.E106-D No.12 pp.2097-2106
Data de publicação
2023/12/01
Publicitada
2023/08/31
ISSN online
1745-1361
DOI
10.1587/transinf.2023EDP7070
Tipo de Manuscrito
PAPER
Categoria
Reconhecimento de imagem, visão computacional

autores

Chee Siang LEOW
  University of Yamanashi
Hideaki YAJIMA
  University of Yamanashi
Tomoki KITAGAWA
  University of Yamanashi
Hiromitsu NISHIZAKI
  University of Yamanashi

Palavra-chave