Data journalism: Frenitalia, come i dati raccontano la realtà del traffico ferroviario

Frenitalia1Lo sapevate che le Frecce registrano in media ritardi maggiori dei treni regionali? E che  il primato nei ritardi va agli Intercity?

E’ uno dei dati più sorprendenti di una inchiesta sul traffico ferroviario in Italia – dal titolo azzeccatissimo di ‘’Frenitalia’’ -  realizzata da Davide Mancino e pubblicata su Scrollkit.com per la Fondazione Ahref.

 

La ricerca  effettuata da Mancino ha rilevato fra l’ altro, che nelle 43 tratte ferroviarie considerate (e su un campione di 36.000 corse) oltre l’ 80% delle volte il treno regionale è arrivato entro 5 minuti dall’ orario previsto e quindi di fatto in orario.

 


Mentre le Frecce invece superano appena il 60% (nelle oltre 21mila corse considerate) del tasso di puntualità (quindi 2 su 5 non sono state puntuali). E, infine, i treni Intercity hanno un tasso ancora inferiore, con il 56% di puntualità su un totale di 4.700 corse.

 

Attraverso un lavoro sul campo – registrare tutti i giorni, per quasi tre mesi, i dati di tutti i treni che hanno percorso le 43 tratte – Mancino ha elaborato alcune mappe interattive che riassumono le varie caratteristiche del sistema ferroviario nel nostro paese, aggirando la politica di ‘’riservatezza’’ delle Ferrovie dello Stato, molto avara nella diffusione di dati statistici.

 

Frenitalia2

 

Quando Davide Mancino parte, si rende conto subito che ‘’di dati ce ne sono pochissimi, o comunque non sono disponibili, e anche quando sono disponibili sono molto generici. ‘Queste informazioni – spiega su Ahref – non te le daranno mai’, mi ha detto una fonte. Tutto per un servizio che – non dimentichiamolo – è e resta pubblico, dunque pagato dalle nostre tasse’’.

 

Ecco il suo racconto:

 

Il fondamento dell’inchiesta è stato il sito Viaggiatreno, di Trenitalia, in cui ciascuno può inserire il numero del proprio treno e vedere se è puntuale o meno. Un amico programmatore, Francesco Zarrelli, è stato così gentile da scrivere per me uno scraper e questi sono stati i primi due mesi: lavoro, test, nuove modifiche, altro lavoro, nuovi test.

 

Poi è arrivata la parte più noiosa: far girare il programma per tre mesi – ogni giorno – dal 12 settembre fino al 10 dicembre, così da poter analizzare il maggior numero di dati possibili per un certo numero di corse. L’ideale sarebbe stato farlo per tutti i treni, ma presto ci siamo resi conto che avrebbe richiesto un sforzo molto al di là delle nostre possibilità tecniche.

 

Raccolti i dati li ho elaborati, cercando di presentarli nel modo più semplice e interessante possibile: da qui l’idea di una mappa e di un lavoro che ha la struttura del long-form journalism – sulla scia (in piccolo, s’intende) di webdoc come Snowfall del New York Times.

 

Come ho ricordato nell’articolo, i dati raccolti vanno presi con il giusto grado di scetticismo che dovremmo avere verso qualsiasi cosa leggiamo. Sono stati raccolti e studiati al meglio delle mie possibilità e competenze, ma – lo sottolineo – non si tratta di uno studio scientifico. Esiste sempre un margine di errore, tanto più se si tratta di un esperimento (almeno a mia conoscenza) mai tentato in Italia. Il mio invito è prendere questa inchiesta come una base per fare di più e meglio in futuro.

 

Perché fare una cosa del genere? Ho realizzato Frenitalia per mostrare che l’apertura dei dati al pubblico può creare un ecosistema informativo nuovo, più adatto alla società complessa in cui viviamo. Le informazioni esistono, possono e devono essere raccontate, se vogliamo che le cose cambino.

Alla fine della fiera però lo scopo resta lo stesso: realizzare quella che è sempre stata una delle promesse del giornalismo – un cittadino informato è un cittadino migliore. Come scriveva Luigi Einaudi, la necessità è sempre quella di “conoscere per deliberare”.

 

@davidemancino1