ccampa896 / estatistica-r-parte-1

Curso de Estatística com R pela Alura

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Curso: Estatística com R: frequência e medidas

Alura - Escola online de tecnologia

UniCesumar

Pessoal, boa tarde! Sejam bem-vindos e bem-vindas neste projeto inicial de Estatística com utilização da linguagem R como ferramenta.

Antes de mais nada, para contextualizar, atualmente sou estudante do curso Superior de Tecnologia em Ciências de Dados e Análise de Comportamento da UniCesumar. Atualmente estou cursando a disciplina de Estatística e realizando paralelamente o Projeto de Ensino INTERPRETAÇÃO DE DADOS ATRAVÉS DA ESTATÍSTICA DESCRITIVA no Módulo 52 do ano de 2023.

Para agregar meus conhecimentos, nada melhor do que colocá-los em prática juntamente com a Formação Estatística com R da Alura, uma das maiores Escolas online de tecnologia do Brasil.

Este projeto nada mais é do que scripts de código e texto, os conhecidos Jupyter Notebooks, de duas plataformas: Google Colab com o kernel para linguagem R e Kaggle. Foi utilizado o RStudio, IDE mais do que atualizada e otimizado para programar em linguagem R.

Neste trabalho, foi desenvolvido a primeira parte da Formação da Alura. Para tanto, utilizei um arquivo CSV oriundo da Pesquisa Nacional por Amostra de Domicílios - PNAD, ano de 2015.

Foram abordados os seguintes tópicos:

CONHECENDO OS DADOS

  • Dataset do projeto

  • Fonte dos Dados
  • Variáveis utilizadas
  • Informações básicas do R
  • Como importar bibliotecas
  • Documentação: acessando ajuda
  • Importando o dataset do projeto
  • Tipos de dados

  • Variáveis qualitativas ordinais
  • Variáveis qualitativas nominais
  • Variáveis quantitativas discretas
  • Variáveis quantitativas contínuas
  • Classificação de uma variável

DISTRIBUIÇÃO DE FREQUÊNCIAS

  • DISTRIBUIÇÃO DE FREQUÊNCIAS PARA VARIÁVEIS QUANTITATIVAS

  • table
  • prop.table
  • cbind
  • rownames e colnames
  • tapply
  • DISTRIBUIÇÃO DE FREQUÊNCIAS PARA VARIÁVEIS QUANTITATIVAS (classes personalizadas)

  • cut
  • cut
  • order
  • row.names
  • DISTRIBUIÇÃO DE FREQUÊNCIAS PARA VARIÁVEIS QUANTITATIVAS (classes de amplitude fixa)

  • nrow
  • log
  • round
  • Regra de Sturges
  • Histograma

MEDIDAS DE TENDÊNCIA CENTRAL

  • Média aritmética
  • Mediana
  • Moda
  • Relação entre média, mediana e moda

MEDIDAS SEPARATRIZES

  • Quartis
  • Decis
  • Percentis
  • Box-plot

MEDIDAS DE DISPERSÃO

  • Desvio médio absoluto
  • Variância
  • Desvio padrão

Foram utilizados três arquivos para desenvolver o projeto:

  • Análise_Descritiva.ipynb: arquivo contendo o projeto final do curso
  • curso-estatistica-r.ipynb: arquivo utilizado durante as aulas
  • dados.csv: arquivo contendo a base de dados utilizada na análise

stats graph languages graph

kaggle logo r logo rstudio logo jupyter logo

About

Curso de Estatística com R pela Alura


Languages

Language:Jupyter Notebook 100.0%