A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Price Rank Prediction of a Company by Utilizing Data Mining Methods on Financial Disclosures Previsão de classificação de preços de uma empresa utilizando métodos de mineração de dados em divulgações financeiras

Mustafa Sami KACAR, Semih YUMUSAK, Halife KODAZ

  • Exibições de texto completo

    0

  • Cite isto

Resumo:

O uso de relatórios em ação cresceu significativamente nas últimas décadas, à medida que os dados foram digitalizados. No entanto, os métodos estatísticos tradicionais já não funcionam devido à expansão incontrolável e à complexidade dos dados brutos. Portanto, é crucial limpar e analisar dados financeiros usando métodos modernos de aprendizado de máquina. Neste estudo, os relatórios trimestrais (ou seja, registros do 10T) de empresas de capital aberto nos Estados Unidos foram analisados ​​utilizando métodos de mineração de dados. O estudo utilizou 8905 relatórios trimestrais de empresas de 2019 a 2022. A abordagem proposta consiste em duas fases com uma combinação de três métodos diferentes de aprendizado de máquina. Os dois primeiros métodos foram utilizados para gerar um conjunto de dados a partir dos arquivamentos 10Q com extração de novos recursos, e o último método foi utilizado para o problema de classificação. O método Doc2Vec no framework Gensim foi usado para gerar vetores a partir de tags textuais em arquivamentos 10Q. Os vetores gerados foram agrupados utilizando o algoritmo K-means para combinar as tags de acordo com sua semântica. Desta forma, 94000 tags representando diferentes itens financeiros foram reduzidos para 20000 clusters compostos por essas tags, tornando a análise mais eficiente e gerenciável. O conjunto de dados foi criado com os valores correspondentes às tags nos clusters. Além disso, a métrica PriceRank foi adicionada ao conjunto de dados como um rótulo de classe que indica a força dos preços das empresas para o próximo trimestre financeiro. Assim, pretende-se determinar o efeito dos relatórios trimestrais de uma empresa no preço de mercado da empresa para o próximo período. Por fim, um modelo de Rede Neural Convolucional foi utilizado para o problema de classificação. Para avaliar os resultados, todas as etapas do método híbrido proposto foram comparadas com outras técnicas de aprendizado de máquina. Esta nova abordagem poderá ajudar os investidores a examinarem as empresas colectivamente e a inferirem conhecimentos novos e significativos. O método proposto foi comparado com diferentes abordagens para criação de conjuntos de dados por meio da extração de novos recursos e tarefas de classificação e, eventualmente, testado com diferentes métricas. A abordagem proposta teve um desempenho comparativamente melhor do que outros métodos de aprendizado de máquina para prever a força futura dos preços com base em relatórios anteriores com uma precisão de 84% no conjunto de dados de registros do 10T criado.

Publicação
IEICE TRANSACTIONS on Information Vol.E106-D No.9 pp.1461-1471
Data de publicação
2023/09/01
Publicitada
2023/05/22
ISSN online
1745-1361
DOI
10.1587/transinf.2022OFP0002
Tipo de Manuscrito
Special Section PAPER (Special Section on Log Data Usage Technology and Office Information Systems)
Categoria

autores

Mustafa Sami KACAR
  Konya Technical Univ.
Semih YUMUSAK
  KTO Karatay Univ.
Halife KODAZ
  Konya Technical Univ.

Palavra-chave