henriquepgomide / caRtola

Extração de dados da API do CartolaFC, análise exploratória dos dados e modelos preditivos em R e Python - 2014-22. [EN] Data munging, analysis and modeling of CartolaFC - the most popular fantasy football game in Brazil. Data cover years 2014-23.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Atualização dos dados

IanWik opened this issue · comments

Boa noite, gostaria de perguntar como estão sendo feitos atualizações dos dados aqui, pois percebi que algumas vezes alguns não são atualizados. Desta vez a média dos jogadores ficou pra trás

Quais dados estão desatualizados? Em qual tabela? Acabei de chegar aqui no repo, e dependendo do problema eu acho que posso ajudar.

oi, @Eric-Mendes
seria bom ter os dados agregados de todos os anos em uma única tabela, como os dessa pasta. Se você puder ajudar a gente a fazer isso, ia ser de grande ajuda.

Quaisquer dúvidas, só perguntar por aqui

@Eric-Mendes , precisa de ajuda? :)

Oi pessoal, conheci o repositório a pouco tempo e encontrei essa issue. Ainda precisam de ajuda com ela?

oi, @suttergustavo
sim! Você poderia ajudar a gente nisso, por favor?

Show! Posso fazer isso sim!

Se eu entendi certo o data/dados_agregados_limpos.csv tem todos os jogadores em todas as rodadas em todos os anos (2014 até 2017, no caso). A ideia então seria gerar um único csv com tudo isso mas com todos os dados disponíveis (2014-2020), certo?

No processo meio que já vai sair de graça o agregado por ano, que pelo visto não está disponível desde 2019, então já posso gerar essas tabelas também.

Estava olhando como o data/dados_agregados_limpos.csv foi gerado pelo src/python/Análise dos Dados.ipynb, mas não consegui encontrar o arquivo data/dados_agregados.csv que serviu de base. Vocês sabem se esse arquivo mudou de nome ou foi removido? Senão der tá tranquilo, imagino que consigo gerar algo como ele concatenando os arquivos de cada ano ou se der já parto dessa tabela limpa.

A ideia então seria gerar um único csv com tudo isso mas com todos os dados disponíveis (2014-2020), certo?

Exatamente, @suttergustavo

No processo meio que já vai sair de graça o agregado por ano, que pelo visto não está disponível desde 2019, então já posso gerar essas tabelas também.

🙏 Thank you!

não consegui encontrar o arquivo data/dados_agregados.csv que serviu de base. Vocês sabem se esse arquivo mudou de nome ou foi removido?

@henriquepgomide, você pode responder essa aqui?

Sim, removi o arquivo porque estava com inconsistências e erros de cálculo nos atributos.

Sugiro cautela em agregar os dados devido às mudanças de metodologia de scouts ao longo dos anos. Alguns atributos de scouts que não mudaram nomes, mas o critério de registro. Há também scouts novos (passes incomplementos != passes errados).

Entendi, vou pegar a partir dos arquivos individuais mesmo. Já comecei a preparar o código mas tenho que olhar com calma essa diferença nos scouts com o passar dos anos. Obrigado pela ajuda, pessoal!