A funcionalidade de pesquisa está em construção.
A funcionalidade de pesquisa está em construção.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Influence of Outliers on Estimation Accuracy of Software Development Effort Influência de outliers na precisão da estimativa do esforço de desenvolvimento de software

Kenichi ONO, Masateru TSUNODA, Akito MONDEN, Kenichi MATSUMOTO

  • Exibições de texto completo

    0

  • Cite isto

Resumo:

Ao aplicar métodos de estimativa, a questão dos valores discrepantes é inevitável. A extensão da sua influência não foi esclarecida, embora vários estudos tenham avaliado métodos de eliminação de valores discrepantes. Não está claro se devemos sempre ser sensíveis aos valores discrepantes, se os valores discrepantes devem ser sempre removidos antes da estimativa e que precauções são necessárias para a recolha de dados do projecto. Portanto, o objetivo deste estudo é ilustrar uma diretriz que sugere com que sensibilidade devemos lidar com outliers. Na análise, adicionamos experimentalmente outliers a três conjuntos de dados, para analisar sua influência. Modificamos a porcentagem de valores discrepantes, sua extensão (por exemplo, variamos o esforço real de 100 a 200 pessoas-hora quando a extensão era de 100%), as variáveis ​​incluindo valores discrepantes (por exemplo, adição de valores discrepantes a pontos de função ou esforço) e o localizações de outliers em um conjunto de dados. A seguir, o esforço foi estimado usando esses conjuntos de dados. Usamos análise de regressão linear múltipla e estimativa baseada em analogias para estimar o esforço de desenvolvimento. Os resultados experimentais indicam que a influência dos valores discrepantes na precisão da estimativa não é trivial quando a extensão ou porcentagem dos valores discrepantes é considerável (ou seja, 100% e 20%, respectivamente). Em contraste, a sua influência é insignificante quando a extensão e a percentagem são pequenas (ou seja, 50% e 10%, respectivamente). Além disso, em alguns casos, a análise de regressão linear foi menos afetada por valores discrepantes do que a estimativa baseada em analogias.

Publicação
IEICE TRANSACTIONS on Information Vol.E104-D No.1 pp.91-105
Data de publicação
2021/01/01
Publicitada
2020/10/02
ISSN online
1745-1361
DOI
10.1587/transinf.2020MPP0005
Tipo de Manuscrito
Special Section PAPER (Special Section on Empirical Software Engineering)
Categoria

autores

Kenichi ONO
  Nara Institute of Science and Technology
Masateru TSUNODA
  Kindai University
Akito MONDEN
  Okayama University
Kenichi MATSUMOTO
  Nara Institute of Science and Technology

Palavra-chave