ondata / appaltipop

ETL scripts and issue tracking for AppaltiPOP project.

Home Page:https://www.appaltipop.it

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Check numeri dati di input

aborruso opened this issue · comments

Al momento il sistema espone i dati su questi CF:

  • 01199250158
  • 00355870221
  • 84006890481
  • 01386030488
  • 00337360978

Gli ultimi due non sono da considerare: il primo è REGIONE TOSCANA, che appare come stazione appaltante in una gara del comune di Prato del 2019, il secondo è la PIVA (e non il CF) del comune di Prato. Il primo non è un errore, il secondo sì.
Vi scriverò una issue a tema.

I numeri per i 3 CF "giusti" sono quelli di sotto (@jenkin per ora li metto qui, poi mi dirai dove metterli).

tenders tenderers suppliers tendersZero ID
3345 6818 3439 226 01199250158
2528 5701 2576 480 00355870221
1826 3432 1843 106 84006890481
  • tenders > il numero di gare
  • tenderers > il numero di partecipanti (non distinct, se utile aggiungo anche il distinct)
  • suppliers > il numero di aggiudicatari (non distinct, se utile aggiungo anche il distinct)
  • tendersZero > il numero di gare con CIG=="0000000000"
{ "tenders": "3345", "tenderers": "6818", "suppliers": "3439", "tendersZero": "226", "ID": "01199250158" }
{ "tenders": "2528", "tenderers": "5701", "suppliers": "2576", "tendersZero": "480", "ID": "00355870221" }
{ "tenders": "1826", "tenderers": "3432", "suppliers": "1843", "tendersZero": "106", "ID": "84006890481" }

@aborruso ma esattamente le colonne cosa rappresentano?

@nelsonmau ma quello che vuoi sapere, non è scritto nel messaggio di sopra (sotto screenshot)?

Temo quindi di non avere capito la domanda

image

Ho fatto male la domanda, a me interessa sapere:

  • totale appalti in input per comune
  • totale appalti validi e pubblicabili sul sito per comune
  • totale non validi ed esclusi dalla pubblicazione
  • totale partecipanti per singolo appalto
  • totale campi richiesti dall'anac
  • totale campi inseriti dai comuni correttamente e validabili per comune
  • totale campi inseriti dai comuni sbagliatamente e non validabili per comune

Inoltre mi servirebbe il sample di un item/appalti per farmi un'idea migliore dei campi previsti, required, opzionali, etc

Il tutto con panne, cialde a parte

grazie! :-)

@nelsonmau ho prodotto anche una cosa di questo tipo, che mi sembra interessante, legata ai partecipanti

ID minimo massimo media moda somma primoQuartile terzoQuartile
00355870221 1 136 2.049838 1 4442 1 2
01199250158 1 94 1.809928 1 6818 1 1
80016350821 1 20 2.634855 1 635 1 3
84006890481 1 41 1.837738 1 2990 1 1

perché no, l'importante è che teniamo sempre presente il nostro focus: non business intellinge sugli appalti (quella lo fa - bene - contrattipubblici.org) ma analisi della qualità e dell'accessibilità dei dati degli appalti ed eventuali approfondimenti (tipo capitolati o altre info).

Il nostro focus dev'essere coerente con la mission di Ondata, e cioè:

Siamo un’associazione che promuove l’apertura dei dati pubblici per renderli accessibili a tutti

tutto il resto imho è secondario

scusa se sembra una lezioncina, ma in realtà la terrei più che altro come una bussola generale

@nelsonmau non voglio fare business intelligence

Siccome sopra chiedevi dei conteggi, questo conteggio esce in modo naturale.

Moreover questo in particolare è interessante, perché molto correlato alla bandiera rossa sul numero di partecipanti per appalto. Che ahimè non sembra un granché.

ottima idea! tutto ciò che risponde agli indicatori ocds è interessantissimo.

ma per esempio sulle date cosa si può fare? tipo incrociando inizio/fine o altro