AlanPrado / FDSI2_titanic

Visualização de dados do titanic

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Resumo

Essa visualização apresenta dados sobre o desastre do navio Titanic que naufragou em 15 de abril de 2011.

A visualização contempla dados de idade, cidade de embarque, e condições economicas sobre todos os passageiros presentes no desastre com exceção da tripulação.

Foi identificado uma correlação entre a probabilidade de sobreviver e o preço do bilhete, o gênero e a idade. Prioridade para mulheres e crianças fazia parte do protocolo de evacuação da epoca. Entretanto, o preço pago pelo bilhete não fazia parte do protocolo. Esta ação acabou favorecendo os passageiros de Cherbourg uma vez que pagaram preços acima da média.

Links

Design

Codificação e Cores

A maior parte dos gráficos utiliza categorias diferentes, e para realçar as Informações foram utilizados paletas para dados qualitativos.

No gráfico de timeline do naufragio foi utilizado paletas para dados qualitativos para destacar os principais eventos.

No grafico das principais familias afetas pelo naufragio foi utilizado uma paleta sequencial para realçar a diferença de quantidade de mortes.

No grafico que mostra o itinerário do Titanic foi utilizado uma paleta divergente para mostrar a transição de uma cidade para outra.

Em alguns momentos foram utilizados o tamanho para realçar a proporção entre os dados comparados.

Foram utilizados formas para destacar elementos. A principal vantagem de utilizar forma foi permitir a visualização de elementos sobrepostos.

Tipos de gráficos

Para visualizar distribuições foram utilizados gráficos de caixa, histograma, barras.

Para visualizar tendência foram utilizados gráficos área e linha utilizando linhas de tendência quando necessário.

Para verificar a relação entre os dados foram utilzados gráficos de pizza e barra empilhados. A escolha entre um e outro dependendia do que gostaria de se comparar.

Gráficos com duas medidas que seriam comparados com o todo, utilizavam o gráfico de pizza.

O gráfico de barra empilhado foi utilizado para comparar proporções de dados de tipos diferentes com mais de três medidas.

Também, foi utilizado um gráfico de bullet com o intuito de comparar medidas em diferentes agrupamentos.

O gráfico de mapa contou com um elemento rota para mostrar o itinerário do navio.

Estrutura da História

Os dados são apresentados progressivamente e a cada etapa é acrescentado um novo dado ou um novo relacionamento.

A proposta foi criar uma foto antes do acidente e uma após o acidente para entender quem foi priorizado no resgate do com relação às caracteristicas fisicas e economicas.

A estrutura da apresentação foi divida da seguinte forma:

Texto - Introdução Gráfico - Relação do preço por classe Gráfico - Relação de idade por sexo Gráfico - Relação de preco por cidade Gráfico - Relação de familias por cidade de embarque Texto - Acidente Gráfico - Relação de sobreviventes por idade e sexo Gráfico - Relação de sobreviventes por preço do bilhete Gráfico - Relação de sobreviventes por classe Gráfico - Relação de sobreviventes por familia Texto - Conclusão

Manipulação de Dados

Foi necessário criar algumas colunas de campo calculado, como por exemplo a coluna de preço por pessoa, onde foi divido o preço pago no bilhete pelo número de pessoas que utilizaram aquele bilhete.

Foi necessário, também, configurar os dados geográficos de latitute e longitude.

Finalmente, varios aliases foram cadastrados.

Comentários

  • Na parte “A inauguraçãofoi um sucesso…” gostei bastante das visualizações mas acredito que o boxplot seja muito avançado para um público sem conhecimentos estatísticos. Creio que a visualização seria bem mais efetiva se utilizasse outra ferramenta; O objetivo era destacar os outliers, e por isso a escolha foi mantida.

  • Na parte " A juventude se destaca…" não gostei muito do gráfico de pizza para a distribuição de homens e mulheres, embora eu ache que seja soó minha perseguição padrão contra gráficos de pizza; Não foi alterado o grafico de pizza para outro tipo de gráfico, pois manter o gráfico de pizza tornava a visualização consistente com a versão do mesmo dashboard para sobreviventes. Entretanto, caso fosse alterado o grafico de pizza faltamente iria ocupar mais espaço o que faria a visualização ficar poluida.

  • Na parte “A partida”: gostei bastante, embora preferiria modificar o # por n ou quantidade; Os textos foram alterados.

  • Na parte “O preço da sobrevivência” achei a 2a visualização bonita mas tive dificuldade de entender o que as linhas significavam. Foi acrecentado uma legenda e textos explicativos.

Pessoas que eu conversei pessoalmente

  • Segundo gráfico da relação de sobreviventes por classe confusa. Tamanho atrapalhou a leitura. Foi removido a codificação de tamanho e feito os ajustes da sessão anterior. Além disso foi acrescentado uma ferramenta de destaque para mostrar a relação entre os gráficos.
  • A sessão de naufrágio ficou com muito texto e não chama a atenção. Foi alterado para um gráfico de timeline.
  • Gráfico de familias e preço por classe ficou com muitos dados. Foi criado uma sessão separada para mostrar a relação das familias afetadas pelo desastre e adicionado gráficos para explicar a relação dos sobreviventes por classe.

Revisor

  • Textos nos tooltips precisam ser alterados para que fiquem mais claros para o leitor. Foram revisados todos os tooltips.
  • Inclua um título na história que demonstre para o leitor o que será mostrado Foi adicionado um titulo na historia.

Recursos

Informações Históricas

Dados

Visualização de dados

Copyright e Licença

Code and documentation copyright 2017-2017 Code released under the MIT License

Autor

Autor Original e lider de desenvolvimento

About

Visualização de dados do titanic

License:MIT License