A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Empirical Evaluation of Mimic Software Project Data Sets for Software Effort Estimation Avaliação empírica de conjuntos de dados de projetos de software mímico para estimativa de esforço de software

Maohua GAN, Zeynep YÜCEL, Akito MONDEN, Kentaro SASAKI

  • Exibições de texto completo

    0

  • Cite isto

Resumo:

Para realizar pesquisas empíricas sobre o desenvolvimento de software industrial, é necessário obter dados de projetos reais de software da indústria. Contudo, apenas alguns conjuntos de dados da indústria estão disponíveis publicamente; e, infelizmente, a maioria deles é muito antiga. Além disso, a maioria das empresas de software atuais não consegue tornar os seus dados abertos, porque o desenvolvimento de software envolve muitas partes interessadas e, portanto, a confidencialidade dos seus dados deve ser fortemente preservada. Para tanto, este estudo propõe um método para gerar artificialmente um conjunto de dados de projeto de software “imitador”, cujas características (como média, desvio padrão e coeficientes de correlação) são muito semelhantes a um determinado conjunto de dados confidenciais. Em vez de usar o conjunto de dados original (confidencial), espera-se que os pesquisadores usem o conjunto de dados simulados para produzir resultados semelhantes aos do conjunto de dados original. O método proposto utiliza a transformada de Box-Muller para gerar números aleatórios normalmente distribuídos; e transformação exponencial e reordenação de números para mimetismo de dados. Para avaliar a eficácia do método proposto, a estimativa de esforço é considerada um domínio potencial de aplicação para o emprego de dados mímicos. Os modelos de estimativa são construídos a partir de 8 conjuntos de dados de referência e seus respectivos dados mímicos. Nossos experimentos confirmaram que os modelos construídos a partir de conjuntos de dados mímicos apresentam desempenho de estimativa de esforço semelhante aos modelos construídos a partir de conjuntos de dados originais, o que indica a capacidade do método proposto em gerar amostras representativas.

Publicação
IEICE TRANSACTIONS on Information Vol.E103-D No.10 pp.2094-2103
Data de publicação
2020/10/01
Publicitada
2020/07/03
ISSN online
1745-1361
DOI
10.1587/transinf.2019EDP7150
Tipo de Manuscrito
PAPER
Categoria
Engenharia de Software

autores

Maohua GAN
  Okayama University
Zeynep YÜCEL
  Okayama University
Akito MONDEN
  Okayama University
Kentaro SASAKI
  Okayama University

Palavra-chave