thaislin0 / Drug-Discovery

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

drug discovery

Esse repositório contém todas as aulas e desafios propostos pela Imersão de Dados do Grupo Alura. O trabalho foi feito em cima de uma base de dados que contém diversos medicamentos que podem ou não surtir efeito em determinada doença. Ele é, também, o meu primeiro projeto em Data Science. A intenção dessa análise é: entender os dados, plotar gráficos, verificar a correlação e causalidade entre as diversas variáveis e levantar conclusões e predições acerca de um descobrimento de uma nova droga.

Ferramentas utilizadas:

  • Python
  • Pandas
  • Numpy
  • Matplotlib
  • Seaborn

Além das ferramentas de programação, utilizamos o Google Colab para registrar e salvar todos os códigos e desafios feitos. No final, foi possível aprender sobre como começar uma análise de dados, como levantar questões pertinentes e como criar gráficos.

Documentações utilizadas: -https://pandas.pydata.org/pandas-docs/version/0.25/user_guide/index.html -https://seaborn.pydata.org/tutorial.html -https://scikit-learn.org/stable/ -https://matplotlib.org/stable/contents.html -https://www.alura.com.br/artigos/google-colab-o-que-e-e-como-usar

Por o assunto da análise de dados envolver a área da biologia, é interesse que alguns temas sejam lidos de forma mais profunda para entender o que está acontencendo na base de dados. Os principais artigos que podem ser verificados são:

-https://docs.google.com/document/d/10EhrQBChlyYIcff3to7PrCQi5HcNk2r-zd2ZCKPtcz8/edit?usp=sharing -https://docs.google.com/document/d/10EhrQBChlyYIcff3to7PrCQi5HcNk2r-zd2ZCKPtcz8/edit -https://www.alura.com.br/artigos/o-que-e-um-histograma

Além disso, é interesse entender as principais terminologias no mundo da estatística e machine learning. Confira:

-https://medium.com/@felipemaiapolo/correla%C3%A7%C3%A3o-n%C3%A3o-implica-em-causalidade-8459179ad1bc -https://machinelearningmastery.com/linear-regression-for-machine-learning/ -https://www.alura.com.br/artigos/ampliando-a-analise-com-describe

Por fim, verique algumas dicas para a visualização de dados aqui: -https://www.alura.com.br/conteudo/data-visualization -https://www.tableau.com/pt-br/learn/articles/data-visualization-tips -https://medium.com/datavizbr/dez-dicas-para-deixar-sua-visualiza%C3%A7%C3%A3o-de-dados-mais-acess%C3%ADvel-bf884895812d

Obrigada por conferir meu primeiro projeto de Data Science.

About


Languages

Language:Jupyter Notebook 100.0%