stinco / elezionipolitiche2018

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Leggimi

Degli script per scaricare i dati sulle elezioni politiche del 4 marzo 2018 in Italia e i dati stessi.

La fonte è http://elezioni.interno.gov.it/eligendo.

Script

Sono due script in bash:

  • dwVotanti.sh per scaricare i dati sui votanti di questa tornata elettorale;
  • dwScrutini.sh per scaricare i risultati di questa tornata elettorale.

Dati

Tutti i CSV elencati a seguire utilizzano come separatore la , e l'encoding è UTF-8.
I dati replicano lo schema di output originale (con piccole modifiche):

  • questo un file per come è esposto sul sito del ministero;
    • da qui estriamo la parte anagrafica in testa ad ogni file di output, per costruire un file di riepilogo (come questo)
    • estraiamo i dettagli (un esempio);
    • mettiamo insieme i file con i dettagli per creare alcuni dei file di insieme indicati sotti.

Anagrafica codici Comuni, Ministero vs ISTAT

  • comuniViminaleISTAT.csv, una tabella che mette in relazione i codici assegnati dal Ministero dell'Interno ai codici comunali di ISTAT.

Anagrafica geografica

Sotto un esempio della struttura gerarchica per la Camera.

Nota Bene: alla voce denominata "Comune" su Eligendo non corrispondono sempre in modo univoco dei comuni, ma per città grandi anche parte di esse (come 24120550510, che non è il Comune di Palermo per intero, ma una sua parte).

ID Nome Livello gerarchico URI
24000000000 SICILIA 1 Circoscrizione http://elezioni.interno.gov.it/camera/scrutini/20180304/scrutiniCI24000000000
24100000000 SICILIA 1 - 01 Collegio plurinominale http://elezioni.interno.gov.it/camera/scrutini/20180304/scrutiniCI24100000000
24120000000 02 - PALERMO - LIBERTÀ Collegio uninominale http://elezioni.interno.gov.it/camera/scrutini/20180304/scrutiniCI24120000000
24120550510 PALERMO - SICILIA 1 - 01 - 02 Comune http://elezioni.interno.gov.it/camera/scrutini/20180304/scrutiniCI24120550510

Votanti

NOTA BENE: manca la sezione Estero

Scrutini

NOTA BENE: manca la sezione Estero

Note

  • i numeri interi sono in origine riportati come stringhe con un inutile ed errato separatore delle migliaia. Ad esempio "sk_bianche": "2.698" doveva essere "sk_bianche": 2698;
  • i nomi dei candidati sono riportati come Nome Cognome, mentre nelle liste candidati di "Elezioni trasparenti" come Cognome Nome. Non essendoci un ID candidato è quindi impossibile fare JOIN (a meno di non riorganizzare complessivamente i dati);
  • i codici dei collegi elettorali di ISTAT sono differenti da quelli utilizzati dal Ministero degli Interni (vedi qui);
  • alcuni candidati hanno il loro nome all'interno del campo "voti_cand" (vedi #9);
  • alcune liste hanno valori "NaN,00" per le percentuali di voto (vedi #8);
  • ci sono comuni con una percentuale di votanti superiore al 100% (vedi #11);
  • i dati originali non hanno alcun identificativo (vedi #12).

Sitografia

Una raccolta di post che hanno a che fare con questi dati:


Licenza Creative Commons
Quest'opera è distribuita con Licenza Creative Commons Attribuzione 4.0 Internazionale.

About

License:Creative Commons Attribution 4.0 International


Languages

Language:Shell 100.0%