arturlbg / Enem_2018_Analise-Dados

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

O dataset do Enem 2018 é composto de quase 3.700.000 linhas e 94 variavéis, foi filtrada algumas variavéis interessantes para a análise

*Todos os dados foram pré-processados*

Heatmap

Esse gráfico tem como principal característica a fácil identificação de itensidade de relação entre 2 variavéis, é com ele que podemos ter algumas idéias para outros gráficos. Podemos ver por exemplo que a "idade" e "estado civil" tem uma interligação, outras relações podem ser óbvias como "tipo de escola" e "dependência admnistrativa da escola".

Heatmap

Idade e quantidade de candidatos

Aqui vemos a maior quantidade de candidatos do enem na margem dos 20 anos.

110220265-25919900-7ea3-11eb-837c-13060ab15e80

Tipo de escola e média

Observamos que a média entre alunos de escolas públicas e escolas particulares não tem uma disparidade tão alta.

Grafico tipo de escola e média

Quantidade de candidatos por renda familiar em notação científica (1.4 = 1.400.000)

Observamos que há mais candidatos na renda familiar "C", ou seja, entre R$945,00 e R$1431,00.

renda_familiar_completo

Média do ENEM por região em cada matéria

Nesses gráficos de pizza estão demonstradas a média de todos candidatos por matéria nas 5 regiões do Brasil, destacando no gráfico a maior média, onde normalmente é Ciências Humanas.

Notas por região(Sul)

Notas por região(Sudeste)

Notas por região(Centro-Oeste)

Notas por região(Nordeste)

Notas por região(Norte)

Nota de linguagens por renda familiar

Nesse gráfico de linhas deixa explícito que a nota de linguagens aumenta conforme a renda familiar também seja maior.

Renda Familiar e Nota Linguagens

Gráfico de renda familiar e nota média

Nesse gráfico observamos que conforme a renda familiar da familia do candidato aumenta, sua média também aumenta, concluindo que familias com mais condições financeiras obtém melhores notas.

Grafico Renda Familiar e Nota Media

About


Languages

Language:Jupyter Notebook 100.0%