Data journalism, un poâ€™ piÃ¹ di fantasia e di rigore scientifico

Redazione

10 anni fa

Alberto Cairo ha scritto un pezzo molto interessante sul blog del Nieman Journalism Lab, Â spiegando come testate di data-journalism come FiveThirtyEight, Vox e Upshot avessero fatto delle promesse esagerate e non mantenute circa la qualitÃ dei loro contenuti. E sottolineando la necessitÃ di trattare i dati con maggiore rigore scientifico.

Questo aspetto Ã¨ al centro di una riflessione di Derrick Harris, che â€“ su Gigaom â€“ ha aggiunto alcune considerazioni. Eâ€™ un post del 9 luglio, ma pensiamo che valga la pena riproporlo.

Lo scienziato dei dati ideale, viene detto spesso,Â deve avere competenze di base in statistica / matematica, elaborazione di dati non strutturati, interrogazione dei dati attraverso SQL e programmazione. Questi â€“ spiega Harris – sono i requisiti nativi del web, dove i dati assumono spesso forme diverse da i classici numeri in una tabella, e questo richiede un poâ€™ di fatica in piÃ¹ rispetto ai metodi di analisi tradizionali. In mancanza di dati specifici o di prima mano sugli utenti o sui comportamenti che desiderano analizzare, i data-scienziati sono diventati abili nel combinare vari â€˜â€™data pointâ€™â€™ per costruire migliori modelli degli utenti o dedurne alcuni tratti di comportamento.
Questi metodi, secondo Harris, non sono sempre produttivi per il mondo del giornalismo basato sui fatti, ma nonostante questo un posto per loro câ€™ Ã¨. A patto perÃ² che i giornalisti che puntano sui dati abbiano piÃ¹ fantasia e coraggio.

Harris fa lâ€™ esempio di Premise Data, che, ritenendo i Rapporti tradizionali sull’ economia mondiale troppo â€˜â€™lentiâ€™â€™ e spesso privi di una visione di quello che sta accadendo sul terreno in molte aree, Â Â ha deciso di cominciare a produrre direttamente le proprie previsioni. Una rete di cittadini in varie cittÃ di tutto il mondo scattano foto di cose specifiche in momenti specifici (ad esempio, i banconi del latte in un mercato locale) e Premise scava da quelle foto informazioni sui prezzi, sulla distribuzione, ecc.

Il fatto â€“ dice Harris – Â Ã¨ che lÃ fuori câ€™ Ã¨ una fitta rete di dati a disposizione dei giornalisti che vogliano trovarli e fare qualcosa di creativo con essi. Ci sonoÂ grandi dataset geosociali, come GDELT e il corpus Flickr di YahooÂ per le immagini. Ci sono API di vari siti, pattaforme di social media e persino specialisti di musicaÂ come Echo Nest (che ora fa capo a Spotify). Ci sono un numero incalcolabile di pagine web, messaggi e altri contenuti testuali, cosÃ¬ come centinaia di milioni o addirittura miliardi di foto, tutti in attesa di essere â€˜â€™raschiatiâ€™â€™ e analizzati.

E se non c’ Ã¨ niente di buono immediatamente disponibile, non Ã¨ escluso che le redazioni possano creare le proprie scorte di dati. Come fa Premise, o come ha fatto questo entomologo per ottenere dei dati di qualitÃ sul suono delle ali degli insetti e sui loro cicli di attivitÃ .

Nonostante il luogo comune secondo cui i numeri non mentono â€“ osserva ancora Harris -, spesso invece questo accade. Oppure, come sottolinea Cairo nel suo post su Nieman Journalism Lab, Â sono almeno suscettibili di interpretazioni e caratterizzazioni sbagliate. Allora perchÃ© non puntare a fare una analisi piÃ¹ completa, cercando al di lÃ dei numeri ufficiali e di quelli presenti in studi ampiamente pubblicizzati, e iniziare a pensare quali punti possono essere collegati utilizzando i social media, quali testi possono essere analizzati per temi e per taglio cuturale e, in generale, quali dati supplementari possono essere tirati fuori in per costruire un argomento piÃ¹ forte o una previsione piÃ¹ accurata?

Quantificare gli argomenti che interessano e cercare di illuminare i lettori Ã¨ un obiettivo nobile â€“ conclude il giornalista -, ma Ã¨ difficile farlo utilizzando gli stessi dati intorno a cui si gira sempre e che non sono serviti concretamente per raggiungere quegli obiettivi. Dico insomma, piÃ¹ creativitÃ , altrimenti si rischia di riprodurre gli stessi vecchi risultati mettendoli solo, semmai, in una confezione piÃ¹ accattivante.