OTIMIZAÇÃO DE MODELOS LLM PARA AUXILIAR NA REVISÃO DE CÓDIGO EM CLOJURE
Resumo
A revisão de código é uma parte essencial do ciclo de desenvolvimento de software, pois garante qualidade e minimiza o surgimento de bugs. Contudo, ainda é realizada majoritariamente de forma manual por outros desenvolvedores. Embora muito relevante, ela ainda é considerada demorada, custosa e suscetível a erros. O surgimento de Grandes Modelos de Linguagem possibilitou a automação de várias tarefas, incluindo a assistência nessa atividade. Assim, o propósito deste trabalho é explorar a utilização desses modelos no processo de revisão de código, utilizando a linguagem de programação Clojure, que, apesar de ser relativamente emergente, tem ganhado notoriedade no mercado. O modelo escolhido para a condução desta pesquisa foi o Mistral-7B-Instruct-v0.2, combinado com a técnica de aprimoramento Retrieval Augmented Generation (RAG), que em português é traduzida para Geração Aumentada por Recuperação. Os dados foram obtidos de projetos open source disponíveis na plataforma do GitHub, e os resultados de ambos os modelos foram avaliados por meio de similaridade de cosseno. Por fim, os resultados mostraram que o modelo consegue revisar código de forma comparável a revisores humanos, e que a técnica de aprimoramento consegue fornecer revisões mais específicas quando comparado com o modelo sem técnica de aprimoramento.