RodrigoMenegat / jgd-1

Página para o primeiro semestre do meu curso de jornalismo de dados // Page for the first semester of my data journalism course

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Jornalismo Guiado por Dados 1

Essa disciplina apresenta o modo de pensar e as ferramentas necessárias para que o jornalista trabalhe com dados de maneira eficiente.

Durante as aulas, serão expostas estratégias para contar boas histórias a partir de dados públicos e técnicas para coletar informações não-estruturadas e produzir bancos de dados exclusivos. Assim, o aluno vai aprender a “entrevistar os números” para extrair informações de interesse jornalístico.

Além do foco na produção de conteúdo, também será abordado o uso de informações quantitativas para tomar decisões gerenciais ou editoriais de acordo com o comportamento e as métricas da audiência.


Índice


Como funciona?

A aula

Temos encontros semanais todas as manhãs entre os dias 16 de março e 27 de abril. Isso significa que tenho quatro horas para dar aula. Muitas vezes, isso vai ser tempo demais.

Para tornar o dia mais suportável e produtivo, vou dividir as atividades em duas metades. Na primeira parte, eu falo um monte, apresento o conteúdo e discutimos. Na segunda, começamos a fazer exercícios da semana de forma colaborativa. Sugiro que aproveitem para dar uma boa olhada nas questões e tirar dúvidas presencialmente.

Sistema de avaliação

Gosto de coisas simples e diretas. Para cada semana de aulas, vocês vão receber uma série de exercícios. Cada um deles vale 100 pontos. Ao fim da disciplina, vou calcular a média dessas notas, que vai ser a pontuação final.

Algumas das aulas vão ter duas opções de conjuntos de exercícios: a "confortável" e a "desafiadora".

Ambos vão trabalhar os mesmos conceitos jornalísticos, mas o primeiro pode ser feito com ferramentas mais simples, enquanto o segundo vai exigir algumas técnicas mais avançadas e apresentar conceitos de programação.

Você pode escolher qual conjunto de exercícios vai responder, mas seria muito bom se tentasse fazer os dois. As questões desafiadoras sempre serão acompanhas de um passo-a-passo detalhado. O importante é ter contato com as técnicas e não necessariamente domina-las.

Caso escolha fazer as duas atividades (faça isso, vai ser legal!), na hora de calcular a média vou considerar apenas aquela em que você for melhor. Além disso, você vai ganhar um bônus de nota para cada atividade desafiadora que completar.

Logística

Além deste site, que contém uma descrição geral do curso e links para os exercícios de cada semana, temos também uma newsletter. Ela vai ser usada para mandar lembretes sobre deadlines da semana e, eventualmente, para compartilhar boas reportagens e infográficos.

É importante que você assine e acompanhe. Certifique-se de que os e-mails não vão cair no filtro de spam.

Dicas para mandar bem

O curso não deve ser muito apavorante, mas com as dicas abaixo deve ficar ainda mais fácil. Nada do que listo nessa sessão é obrigatório. São apenas sugestões que devem tornar o conteúdo de aula mais proveitoso.

Entrando no mundo da programação

Como já disse, um dos meus objetivos, embora não seja o principal, é apresentar jornalistas ao universo da programação. Não quero transformar ninguém em programador, e na verdade aprender código nem é requisito para passar. A ideia é, justamente, apresentar e desfazer medos.

Entretanto, se você está entusiasmo para virar um jorna-hacker (ou se quer apenas fazer os exercícios desafiadores com facilidade), recomendo que faça o curso Python's not (just) for unicorns.

O material foi elaborado por Jonathan Soma, o professor que me fez virar um programador de verdade e cujo método de ensino eu tento imitar.

Ele vai apresentar de forma super didática conceitos básicos de programação em Python. São coisas que eu não vou conseguir detalhar em aula, mas que vão facilitar demais a vida de quem quer se aventurar na área. Me procure se quiser ajuda com alguma coisa que ver por ali e podemos resolver juntos.

Sites para acompanhar

Fazer bom jornalismo de dados é, na maioria das vezes, adaptar as ideias dos veículos mais criativas e competentes da área. Assim, nem preciso dizer que é muito importante acompanhar boas referências.

Eu consumo diariamente o trabalho dos departamentos gráficos de pesos-pesados como New York Times, Washignton Post, The Guardian, La Nación e Reuters. Entretanto, meu site favorito se chama The Pudding. Sugiro ler estes, mas o mais legal é montar um cardápio com conteúdos que você goste e admire.


Plano de aulas

Encontro 1

Introdução ao Jornalismo de Dados e fundamentos estatísticos para jornalistas

De início, vou apresentar a dinâmica da disciplina, o sistema de avaliação e todas as formalidades que se costuma esperar de uma primeira aula.

Em seguida, vamos falar da história do jornalismo de dados: pensamos nesse gênero como algo super moderno, mas há pesquisadores que vêm elementos da prática já no século XVI – como chegamos de lá até aqui, e o que mudou no processo?

Para terminar, serão apresentados conceitos matemáticos simples que fazem toda a diferença na hora de trabalhar com números em uma matéria. A ideia é se familiarizar e ficar confortável com taxas, variações e comparações entre grandezas. Não é nada de outro mundo, mas necessário para avançar para partes mais técnicas da disciplina.

Slides

Leituras recomendadas

Leituras aprofundadas

Avaliação:

  • Conjunto de exercícios 1.1

    Você vai resolver uma série de exercícios que trabalha conceitos básicos de compreensão numérica. São perguntas sobre taxas, percentuais, variação ao longo do tempo, comparação de grandezas, correlação, causalidade e coisas do gênero.


Encontro 2

Explorando bases de dados públicas: coleta, limpeza e análise

É nessa aula que começamos a sujar as mãos de verdade. De início, vamos falar sobre os conceitos de open data e open data journalism. Depois, olharemos para marcos históricos na política de dados abertos brasileira, com ênfase na Lei de Acesso à Informação, comparando-a com outros países. Em seguida, vamos visitar as principais fontes públicas de dados que podem ser úteis para reportagens, escolher uma delas e explora-la juntos.

Slides

Leituras recomendadas

Listas de serviços de acesso à informação:

Avaliação

Aqui, começa o esquema de “dois caminhos” para cada uma das tarefas, do qual falei no começo do documento. Você pode escolher qualquer um dos conjuntos de exercícios. Será ótimo se você puder tentar fazer os dois, mesmo que parcialmente – ou, ao menos, dar uma olhada no segundo conjunto. Entretanto, sei que a vida é corrida e super entendo se conseguir fazer apenas um.

  • Conjunto de exercícios 2.1: confortável

    Você vai precisar acessar dados em portais de dados abertos, baixá-los, limpá-los e analisá-los usando Excel ou Google Sheets. As perguntas vão ser tanto específicas (“quanto o PIB brasileiro cresceu entre 2009 e 2014, de acordo com o IBGE?”) ou abertas (“escreva um lead interessante com os dados que analisou”).

  • Conjunto de exercícios 2.2: desafiador

    Nesse conjunto, vamos fazer duas coisas: analisar bases de dados maiores, daquelas que o Excel não dá conta, e apresentar o conceito de APIs. Para isso, vamos começar a brincar com as linguagens Python e SQL. Não entre em pânico ainda: tentei ser o mais didático possível no material, apresentando os conceitos passo a passo, desde a instalação dos programas até a execução do código. Meu objetivo não é transformar ninguém em programador (temos aulas de menos para isso), mas mostrar o caminho para quem quiser ir atrás dessas competências por conta própria.


Encontro 3

Criando bases de dados autorais a partir de dados não (tão) estruturados

Bases de dados governamentais têm seus problemas, mas no geral são bastante limpas e completas. Entretanto, muitas vezes elas são insuficientes para dar conta de uma apuração. Pode ser também que você queira explorar um tema no qual a oferta de dados abertos é limitada.

Isso não é motivo para abandonar a pauta: a vida pode ficar um pouco mais complicada, mas é possível organizar os dados de lugares onde a informação não está tão aberta ou estruturada. Nessa aula, vamos aprender a lidar com tabelas em formato PDF e a “raspar” dados de páginas que não oferecem opção de download.

Slides

Leituras recomendadas

Avaliação

Mais dois conjuntos de exercícios, no mesmo esquema de “confortável” e “desafiador”. Ambos lidam com a coleta de informação não estruturada. O primeiro usa apenas ferramentas “prontas” para extrair dados. O segundo mostra como raspar dados usando Python. De novo, não se assuste! Vamos passo por passo.

  • Conjunto de exercícios 3.1: confortável

    Vamos praticar a transformação de PDFs em planilhas usando o Tabula, extrair dados de sites sem opção de download com extensões de raspagem de dados para o Chrome, nos conectar com tabelas em HTML usando o Google Sheets e automatizar a coleta de tweets usando o IFTTT.

  • Conjunto de exercícios 3.2: desafiador

    Com as ferramentas do conjunto de exercícios 3.1 dá pra fazer muita coisa, mas com o que temos aqui dá pra fazer muito mais. Vamos transformar documentos escaneados em algo mais ou menos aberto, automatizar a raspagem de várias páginas de tabelas e transformar o Google Chrome em um robô.


Encontro 4

Técnicas de narrativa: textões, visualizações de dados e outros formatos

A essa altura do campeonato, já sabemos coletar dados e fizemos algumas perguntas para eles. Provavelmente já descobrimos uma história legal. Mas como comunicar ela da maneira mais efetiva? Nessa aula, vamos analisar bons exemplos de narrativa e aprender as técnicas por trás delas. Além disso, vamos estudar os princípios da comunicação efetiva com gráficos e tabelas.

Leituras recomendadas

Leituras aprofundadas

Sim, os dois livros abaixos são pagos e não são fáceis de encontrar de graça por aí. Entretanto, são leituras praticamente definitivas sobre visualização de dados e jornalismo gráfico. Recomendo demais comprar uma cópia, ainda que seja caro.

  • Alberto Cairo - The Functional Art

    A função da infografia é informar, não apenas ilustrar. A partir desse princípio básico, Alberto Cairo reflete sobre e ensina como fazer narrativas gráficas efetivas. Ele é um entusiasta da comunicação visual e vai fundo na defesa dela, trazendo desde conceitos de neurologia até design da informação

  • Alberto Cairo - The Truthful Art

    Praticamente uma sequência do livro anterior, mas dedicada exclusivamente à visualização gráfica de informações quantitativas - ou seja, às visualizações de dados que queremos aprender a fazer bem nessa aula. O capítulo sobre análise exploratória é ótimo.

Avaliação

  • Conjunto de exercícios 4.1

    Esse é um exercício mais aberto do que os anteriores, sem a divisão entre "confortável" e "desafiador". Escolha uma base de dados, ache uma história e elabore a narrativa que achar mais adequada. Vou dar atenção especial para os elementos gráficos, conforme os parâmetros e boas práticas vistos em aula. Idealmente, você vai bolar uma peça jornalística que vai além do “textão”.

Material extra:

Os links abaixo vão mostrar ferramentas úteis para elaborar boas visualizações de dados e, por tabela, para fazer o exercício da semana.


Encontro 5

Usando dados quantitativos para pensar estratégias: métricas e analytics

Até aqui, usamos números para encontrar notícias e produzir reportagens. Entretanto, esse não é o único uso que dados podem ter no jornalismo. Na era digital, tudo são dados – até o comportamento dos usuários de um site. Nessa aula, vamos ver como as técnicas que aprendemos anteriormente podem ser usadas para analisar métricas e planejar decisões editoriais e de negócios.

Slides

-Usando métricas para melhorar o jornalismo

Leituras recomendadas

Avaliação

Sem exercícios nessa semana. Aproveite para se dedicar ao material que você começou a produzir no encontro anterior.


Encontro 6

Fronteiras do jornalismo computacional e de dados: quem eu devo imitar?

Na última aula desse primeiro módulo, vamos olhar para os principais exemplos de jornalismo de dados no mundo. O que coloca essas publicações na vanguarda? Que tipo de tecnologia elas usam? Como organizam suas redações e seu fluxo de trabalho? Também vamos entender os conceitos de “jornalismo computacional” e “reportagem sobre algoritmos”, que levam a ideia de trabalho com dados e código a um lugar completamente novo.

Slides

Leituras recomendadas

Leituras aprofundadas

  • Nikki Usher - Interactive Journalism: hackers, data and code

    Outro livro que é difícil de achar, mas que vale a pena ter. Nikki Usher é uma pesquisadora da Universidade de Illinois que tem feito um tipo de estudo de que eu gosto muito: observação participante em redações, flertando com técnicas da etnografia. Dessa vez, ela visitou jornais de vários países para descobrir como as equipes de "jornalismo interativo" trabalham. Ela constrói conceitos interessantes e oferece uma visão bastante ampla das rotinas produtivas, competências mobilizadas e pressões a que essa vanguarda do jornalismo digital está sujeita.

Avaliação

Sem exercícios de novo, mas com uma tarefa simples: selecionar dois ou três links de trabalhos de dados que você achou legais e explique o que eles têm de especial. Coisa curta, não mais de um parágrafo para cada.


Material online

A carga horária do curso exige também que eu oferça duas aulas completamente virtuais. Abaixo, você encontra a solução para os exercícios do curso, que certamente tomariam todo o tempo do mundo para fazer presencialmente.

Conteúdo 1:

Conteúdo 2:

About

Página para o primeiro semestre do meu curso de jornalismo de dados // Page for the first semester of my data journalism course