A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Monotone Increasing Binary Similarity and Its Application to Automatic Document-Acquisition of a Category Monotone aumentando a similaridade binária e sua aplicação à aquisição automática de documentos de uma categoria

Izumi SUZUKI, Yoshiki MIKAMI, Ario OHSATO

  • Exibições de texto completo

    0

  • Cite isto

Resumo:

É introduzida uma técnica que adquire documentos da mesma categoria com um determinado texto curto. Considerando o texto fornecido como documento de treinamento, o sistema marca o documento mais semelhante, ou documentos suficientemente semelhantes, dentre o domínio do documento (ou toda a Web). O sistema então adiciona os documentos marcados ao conjunto de treinamento para aprender o conjunto, e esse processo é repetido até que nenhum outro documento seja marcado. Definir uma propriedade crescente monótona para a similaridade à medida que aprende permite que o sistema 1) detecte o tempo correto para que não restem mais documentos para serem marcados e 2) decida o valor limite que o classificador usa. Além disso, sob a condição de que o processo de normalização seja limitado a quais pesos de termo são divididos por uma norma p dos pesos, o classificador linear no qual os documentos de treinamento são indexados de maneira binária é a única instância que satisfaz a propriedade crescente monótona . A viabilidade da técnica proposta foi confirmada através de um exame de similaridade binária e utilizando documentos em inglês e alemão selecionados aleatoriamente na Web.

Publicação
IEICE TRANSACTIONS on Information Vol.E91-D No.11 pp.2545-2551
Data de publicação
2008/11/01
Publicitada
ISSN online
1745-1361
DOI
10.1093/ietisy/e91-d.11.2545
Tipo de Manuscrito
Special Section PAPER (Special Section on Knowledge, Information and Creativity Support System)
Categoria
Aquisição de conhecimento

autores

Palavra-chave