michelmf / projeto_tb

Applying machine learning models to detect tuberculosis during screening process.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Introdução

Projeto com o título "Aprendizado de máquina aplicado ao suporte à triagem de pacientes suspeitos de tuberculose pulmonar", desenvolvido como parte dos requisitos necessários à obtenção do título de Engenheiro Eletrônico e de Computação da Universidade Federal do Rio de Janeiro.

Este trabalho compreende o desenvolvimento de um modelo computacional baseado em Aprendizado de Máquina para atuar como um Sistema de Apoio à Decisão (SAD) no auxílio à triagem de pacientes com suspeita de tuberculose pulmonar. A proposta é que o SAD, a partir de dados coletados durante a rotina de triagem do paciente, seja capaz de indicar a possibilidade do mesmo ser portador de tuberculose pulmonar. Serão avaliados algoritmos baseados em Aprendizado de Máquina utilizando como figura de mérito a área sob a curva ROC (AUC). Os modelos são escolhidos a partir do escore AUC e as performances são comparadas a partir do uso de testes estatísticos.

Resumo

A tuberculose (TB) é apontada pela Organização Mundial da Saúde como uma das dez maiores causas de morte no mundo. Esforços mundiais têm sido realizados para o controle da doença, que concentra as maiores taxas de infectados em países em subdesenvolvimento, incluindo o Brasil. A apresentação da tuberculose na forma pulmonar é a mais relevante para o controle da doença, pois é a responsável pela manutenção da cadeia de transmissão, realizada por meio de bacilos expelidos durante a fala ou tosse.

Os principais métodos de diagnóstico da doença são a baciloscipia direta do escarro e o exame de cultura. A baciloscopia possui baixa sensibilidade, em torno de 60%, e o resultado do teste de cultura pode levar até 12 semanas para conclusão. Recentemente, testes rápidos moleculares foram introduzidos para o diagnóstico da TB, oferecendo acurácias superiores, porém possuem altos custos e demandam uma infraestrutura específica para a sua realização. Desta forma, o processo de triagem de pacientes bem como a experiência do profissional de saúde são elementos cruciais para o diagnóstico da doença. Neste contexto, ferramentas que ofereçam suporte às decisões médicas são importantes para o aumento dos percentuais de detecção de casos de indivíduos portadores de TB.

Este trabalho propõe analisar o desempenho de técnicas baseadas em aprendizado Supervisionado para a construção de um sistema de apoio à decisão médica, cujo objetivo principal é auxiliar o processo de triagem de pacientes suspeitos de tuberculose pulmonar. Utilizando dados coletados durante a triagem do paciente, é verificada a probabilidade do mesmo ser portador da doença. O melhor modelo computacional avaliado utiliza a regressão logística, que alcançou 82,76% de sensibilidade e 66,49% de especificidade, e uma área sob a curva ROC (AUC) de 0,761.

Palavras-Chave: Detecção de tuberculose, Aprendizado de Máquina, Aprendizado Supervisionado, Sistemas de Apoio à Decisão.

Atualizações

Este projeto foi realizado no ano de 2018, onde somente cinco modelos foram explorados no texto: Regressão Logística, Árvores de decisão, Floresta Aleatória (Random Forest), Redes Neurais e k-NN (k-Nearest Neighbors). Retomando este projeto como exercício, desejo explorar novas abordagens para o problema e descrevê-las neste repositório.

Resultados

Resultado dos modelos obtidos até o momento:

Modelos avaliados em 2018

  • Regressão Logística:
  • Árvores de Decisão:
  • Random Forest:
  • k-NN:
  • Rede Neural:

Novos modelos

  • One-Class Support Vector Machines
  • fdsa

Documentos

Link para o projeto de graduação - (Texto entregue à UFRJ)

About

Applying machine learning models to detect tuberculosis during screening process.


Languages

Language:Jupyter Notebook 100.0%