Projeto com o título "Aprendizado de máquina aplicado ao suporte à triagem de pacientes suspeitos de tuberculose pulmonar", desenvolvido como parte dos requisitos necessários à obtenção do título de Engenheiro Eletrônico e de Computação da Universidade Federal do Rio de Janeiro.
Este trabalho compreende o desenvolvimento de um modelo computacional baseado em Aprendizado de Máquina para atuar como um Sistema de Apoio à Decisão (SAD) no auxílio à triagem de pacientes com suspeita de tuberculose pulmonar. A proposta é que o SAD, a partir de dados coletados durante a rotina de triagem do paciente, seja capaz de indicar a possibilidade do mesmo ser portador de tuberculose pulmonar. Serão avaliados algoritmos baseados em Aprendizado de Máquina utilizando como figura de mérito a área sob a curva ROC (AUC). Os modelos são escolhidos a partir do escore AUC e as performances são comparadas a partir do uso de testes estatísticos.
A tuberculose (TB) é apontada pela Organização Mundial da Saúde como uma das dez maiores causas de morte no mundo. Esforços mundiais têm sido realizados para o controle da doença, que concentra as maiores taxas de infectados em países em subdesenvolvimento, incluindo o Brasil. A apresentação da tuberculose na forma pulmonar é a mais relevante para o controle da doença, pois é a responsável pela manutenção da cadeia de transmissão, realizada por meio de bacilos expelidos durante a fala ou tosse.
Os principais métodos de diagnóstico da doença são a baciloscipia direta do escarro e o exame de cultura. A baciloscopia possui baixa sensibilidade, em torno de 60%, e o resultado do teste de cultura pode levar até 12 semanas para conclusão. Recentemente, testes rápidos moleculares foram introduzidos para o diagnóstico da TB, oferecendo acurácias superiores, porém possuem altos custos e demandam uma infraestrutura específica para a sua realização. Desta forma, o processo de triagem de pacientes bem como a experiência do profissional de saúde são elementos cruciais para o diagnóstico da doença. Neste contexto, ferramentas que ofereçam suporte às decisões médicas são importantes para o aumento dos percentuais de detecção de casos de indivíduos portadores de TB.
Este trabalho propõe analisar o desempenho de técnicas baseadas em aprendizado Supervisionado para a construção de um sistema de apoio à decisão médica, cujo objetivo principal é auxiliar o processo de triagem de pacientes suspeitos de tuberculose pulmonar. Utilizando dados coletados durante a triagem do paciente, é verificada a probabilidade do mesmo ser portador da doença. O melhor modelo computacional avaliado utiliza a regressão logística, que alcançou 82,76% de sensibilidade e 66,49% de especificidade, e uma área sob a curva ROC (AUC) de 0,761.
Palavras-Chave: Detecção de tuberculose, Aprendizado de Máquina, Aprendizado Supervisionado, Sistemas de Apoio à Decisão.
Este projeto foi realizado no ano de 2018, onde somente cinco modelos foram explorados no texto: Regressão Logística, Árvores de decisão, Floresta Aleatória (Random Forest), Redes Neurais e k-NN (k-Nearest Neighbors). Retomando este projeto como exercício, desejo explorar novas abordagens para o problema e descrevê-las neste repositório.
Resultado dos modelos obtidos até o momento:
- Regressão Logística:
- Árvores de Decisão:
- Random Forest:
- k-NN:
- Rede Neural:
- One-Class Support Vector Machines
- fdsa
Link para o projeto de graduação - (Texto entregue à UFRJ)