AndreMartins21 / SISU-UFMG

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

📂 Dados:

Máximo e Mínimo - Chamada REGULAR

Máximo e Mínimo - 1° Chamada

Objetivo:

/> Esse repositório foi de grande valia para os seguintes aspectos:

  • Responder algumas questões que podem surgir em torno do arquivo contendo as notas da primeira edição do SISU UFMG;

  • Melhorar meu desempenho na prática de analises de dados, me fazendo aprender a manipular arquivos não convencionais, como foi o caso desse PDF;

  • Me fez aprender mais acerca de Regex (Regular Expression)


/> Questões analisadas nesse repositório:

  • Maior nota por modalidade selecionada para o SISU UFMG 2021;

  • Cursos com as maiores notas POR MODALIDADE (Cotas e A.C.);

  • Cursos com as menores notas POR MODALIDADE (Cotas e A.C.);

  • Menor nota por modalidade selecionada para o SISU UFMG 2021.

Instruções:

</> O arquivo Excel Dashboard Sisu.xlsx, contém, dinamicamente, o resultado de toda a análise realizada. Segue abaixo uma pequena amostra desse dashboard:

image


</> No arquivo DFbruto.ipynb, está contido todo o processo de construção do dataframe bruto a partir do PDF. Nele, utilizei três bibliotecas do Python:

. PyPDF2 = Utilizada para transformar o conteúdo de um PDF em uma string;

. Regex = Trata-se das expressões regulares, que facilitam expressivamente o trabalho de buscas por cadeias de caractéres específicos em uma string;

. Pandas = Ferramenta essencial para manipulação, filtração e análise de dados. 

</> Já no arquivo DFespecífico.ipynb há o procedimento de criação do dataframe específico para ser usado no Excel. Em tal arquivo, fiz uso das librarys:

. Numpy = Biblioteca do Python usada para criação de arrays multidimensionais (Utilizei-a como testes em alguns casos)

. Pandas

Parceria:

  • Para a efetivação de todo o trabalho de análise, elaborei tudo conjuntamente ao parceiro Gilmar:

🔗 Github: https://github.com/Gilnior

About


Languages

Language:Jupyter Notebook 100.0%