A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Finding Frequent Closed Itemsets in Sliding Window in Linear Time Encontrando conjuntos de itens fechados frequentes em janela deslizante em tempo linear

Junbo CHEN, Bo ZHOU, Lu CHEN, Xinyu WANG, Yiqun DING

  • Exibições de texto completo

    0

  • Cite isto

Resumo:

Um dos problemas mais bem estudados na mineração de dados é computar a coleção de conjuntos de itens frequentes em grandes bancos de dados transacionais. Desde a introdução do famoso algoritmo Apriori [14], muitos outros foram propostos para encontrar os conjuntos de itens frequentes. Entre esses algoritmos, a abordagem de mineração conjuntos de itens fechados despertou muito interesse na comunidade de mineração de dados. Os algoritmos que adotam esta abordagem incluem TITANIC [8], CLOSET + [6], DCI-Closed [4], FCI-Stream [3], GC-Tree [5], TGC-Tree [16] etc. -Stream, GC-Tree e TGC-Tree são algoritmos online que funcionam em ambientes de janela deslizante. Pela avaliação de desempenho em [16], GC-Tree [15] é o mais rápido. Neste artigo, é proposto um algoritmo aprimorado baseado em GC-Tree, cuja complexidade computacional é comprovada como uma combinação linear do tamanho médio da transação e do tamanho médio do conjunto de itens fechados. O algoritmo é baseado no teorema essencial apresentado na Seção. 4.2. Empiricamente, o novo algoritmo é várias ordens de magnitude mais rápido que o algoritmo de última geração, GC-Tree.

Publicação
IEICE TRANSACTIONS on Information Vol.E91-D No.10 pp.2406-2418
Data de publicação
2008/10/01
Publicitada
ISSN online
1745-1361
DOI
10.1093/ietisy/e91-d.10.2406
Tipo de Manuscrito
PAPER
Categoria
Data Mining

autores

Palavra-chave