Estimativa de esforço em story point a partir do texto da user story com aprendizagem de máquina e LLM
Carregando...
Data
2025-09-16
Autores
Currículo Lattes
http://lattes.cnpq.br/7407463326170259
Título da Revista
ISSN da Revista
Título de Volume
Editor
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - UFCG
Resumo
A estimativa de esforço em projetos ágeis de software continua sendo um desafio persistente na indústria, especialmente quando se utilizam artefatos textuais como User Stories para prever os Story Points. Esta tese investiga o uso de técnicas de Processamento de Linguagem Natural (PLN) e Aprendizagem de Máquina (AM) na previsão de esforço, considerando as descrições textuais das User Stories como a principal fonte de informação. Inicialmente, uma revisão sistemática da literatura identificou técnicas predominantes, como Term Frequency – Inverse Document Frequency (TF-IDF) combinado com Support Vector Machine (SVM), e destacou lacunas relacionadas ao uso de atributos de legibilidade, sentimento e subjetividade, bem como à aplicação de Large Language Models (LLMs) nessa tarefa. A pesquisa propôs três abordagens principais: (i) o Neo Legibility Effort Model, que utiliza atributos extraídos automaticamente do texto da User Story para prever o esforço; (ii) o Neo User Story Tutor, uma aplicação baseada em LLMs para sugerir melhorias na escrita das User Stories, visando a maior precisão nas estimativas; e (iii) o Neo LLM Predictor, que utiliza LLMs para estimar diretamente os Story Points com diferentes estratégias (few-shot, zero-shot e fine-tuning). Para suportar os experimentos, foi construído o NeoDataset, um novo conjunto de dados coletado a partir de projetos reais hospedados no GitLab. Os modelos propostos foram avaliados com métricas, como o Mean Absolute Error (MAE), e comparados com baselines consagrados na literatura. Os resultados demonstraram que tanto os atributos de legibilidade quanto os LLMs podem contribuir significativamente para a melhoria das estimativas de esforço em ambientes ágeis. A tese apresenta evidências de que é possível aumentar a acurácia das estimativas por meio da combinação de análise textual e aprendizado de máquina, além de destacar a relevância de aspectos linguísticos na qualidade das User Stories.
Descrição
Palavras-chave
Estimativa de esforço, Large language models, Story point, User story
Citação
Néo, Giseldo da Silva.
Estimativa de esforço em Story Point a partir do texto da User Story
com aprendizagem de máquina e LLM / Giseldo da Silva Néo. – 2026.
306 f. : il. color.
Tese (doutorado em Ciência da Computação) – Universidade Federal
de Campina Grande, Centro de Engenharia Elétrica e Informática, 2025.
“Orientação: Prof. Dr. José Antão Beltrão Moura”.
Referências.
1. Estimativa de Esforço. 2. Large Language Models. 3. Story point.
4. User story. I. Moura, José Antão Beltrão. II. Título.