O GitHub Wiki é utilizado para a construção e definição da documentação de um repositório. Entretanto, sua estrutura pode variar amplamente entre diferentes repositórios open source, incluindo conteúdos para contribuintes, exemplos e tutoriais, manuais de software, entre outros. Este estudo tem por objetivo avaliar a utilização de aprendizagem de máquina para determinar os conteúdos das páginas dos GitHub Wikis, com intenção de identificar a estrutura dos Wikis. Sete modelos de aprendizado de máquina são comparados através das métricas de acurácia, precisão, revocação e F1 score. Regressão Logística e Gradient Boosting foram os modelos que se mostraram mais promissores na classificação a partir de sete categorias de conteúdo predeterminadas.aplicados às estruturas.
- Gabriel Moreira Chaves
- Ian Bittencourt Andrade Jacinto
- Jose Laerte Pires Xavier Junior
- Marco Rodrigo Costa
- Hugo Bastos de Paula