Este curso oferece uma introdução a uma das ferramentas mais potentes para análise de dados: o ambiente de programação R. Entre outros, o curso cobrirá desde a coleta e manipulação de dados até a produção de estatísticas descritivas e visualizações. As aula serão acompanhadas de atividades práticas que envolverão extrair e limpar dados de diversos meios, sintetizar informações e exportar resultados de forma automatizada para Word, LaTeX, PDF e HTML.
O curso está organizado em cinco aulas. Na primeira, trabalharemos com o básico da linguagem R
necessário para criar e manipular vetores e bases de dados. Partindo disso, nas aulas 2 e 3 veremos como utilizar pacotes do tidyverse para limpar, transformar, sintetizar e visualizar dados. Por fim, além de aprendermos a usar funções para rodar testes e modelos comuns em pesquisas, nas aulas 4 e 5 aplicaremos todo o conteúdo visto ao longo do curso para criarmos um pequeno projeto de análise de dados inteiramente replicável.
Certamente não esgotaremos as possibilidades do mundo da análise de dados, ou data science, com o R. Na verdade, seria irrealista prometer isto. Ao fim do curso, entretanto, é esperado que as alunas estejam prontas para utilizar o R
para realizar pesquisa social quantitativa.
Aqui vocês irão encontrar materiais úteis para o desenvolvimento do curso, como scripts, dados e alguns materiais de replicação. Além disso, nesse espaço vocês podem tirar dúvidas por meio do sistema de Issues.
Com a sua conta no GitHub (é necessário criar uma caso não tenha), basta logar, clicar no botão Issues no menu superior e clicar no botão verde New Issue. Coloque um título informativo na sua dúvida, poste seu código (quando precisar de soluções) e marque colegas usando @
(e.g., @meirelesff
para me marcar).