La trasparenza dei dati, un obbiettivo vincente

Alistair Croll, co-fondatore di Year One Labs, societÃ specializzata nel lancio di startup, ed analista di Bitcurrent, focalizza lâ€™attenzione sulla qualitÃ del dato (True Data) piuttosto che sulla quantitÃ (Big Data).Â In un intervento su PaidCOntent.org Croll evidenzia le difficoltÃ nel maneggiare i dati e la necessitÃ di fruire di dati effettivamente reali, e non inquinati (per malizia, per omissione o per caso) alla fonte. Ecco il suo articolo.

—–

di Alistair Croll

(Paidcontent)

(a cura di Andrea Fama) – Durante la recente Strata Conference di New York si Ã¨ fatto un gran parlare della trasparenza dei dati. PoichÃ© oggi grandi quantitÃ² di dati facilmente disponibili e rapidamente analizzabili stanno trasformando le professioni, quegli stessi dati potrebbero modificare il modo in cui regoliamo e governiamo il mondo.

La trasparenza dei dati Ã¨ una promessa vincente. Teoricamente, dovrebbe sradicare la corruzione e livellare il campo da gioco. Piuttosto che regolamentare ciÃ² che fa una societÃ , potremmo regolamentare cosa dovrebbe condividere con il mondo â€“ e poi lasciare che il mondo si confronti con le conseguenze, attraverso il boicottaggio, lâ€™attivismo o la class-action. Si tratta di qualcosa che Michael Nelson del Leading Edge Forum ha descritto come una forma di libertarismo digitale: un patto di trasparenza tra il mondo degli affari ed i consumatori, o tra governi e cittadini. Nelson la chiama divulgazione reciprocamente assicurata (â€œMutually Assured Disclosureâ€).

Pensare che corruzione e inganni possano appassire alla cruda luce dei dati Ã¨ certamente incoraggiante. Con le informazioni finalmente disponibili, le parti interessate non dovrebbero avere difficoltÃ nel verificare i numeri â€“ utilizzando servizi di cloud e visualizzazioni intuitive â€“ e nellâ€™individuare i truffatori.

Ma i dati dicono la veritÃ ?

Il primo problema in cui si imbattono i sostenitori dellâ€™Open data Ã¨ quello di ottenere informazioni attendibili. Guardiamo alla Grecia: 324 ateniesi al momento di pagare le tasse hanno dichiarato di avere una piscina. Quando il governo Ã¨ ricorso a Google Maps nel tentativo di contarle effettivamente, ne ha scoperte 16.974 â€“ nonostante i camuffamenti sotto improbabili teli verdi. Ebbene, anche se gli attivisti hanno a disposizione dei dati per attuare il cambiamento, quei dati potrebbero essere sbagliati.

Un modo per ovviare a ciÃ² Ã¨ quello di procurarsi i dati da sÃ©. Le barriere alla raccolta dati si sono sgretolate con lâ€™avvento dei social network, lâ€™ubiquitÃ informatica ed altre innovazioni. CosÃ¬ come i funzionari del fisco greco possono utilizzare Google Earth per tracciare un quadro dellâ€™evasione, allo stesso modo organizzazioni come Asthmapolis (che si occupa di ricerca sullâ€™asma) possono raccogliere i dati attraverso il crowdsourcing â€“ in questo caso, dotando di GPS gli inalatori â€“ ed utilizzare le informazioni ottenute al fine di plasmare le politiche pubbliche in materia.

Come stabilire quando i dati sono sbagliati?

Una volta ottenuti i dati, Ã¨ necessario analizzarli correttamente. E non si tratta di una cosa semplice come potrebbe sembrare.

Se il lavoro del programmatore non Ã¨ efficace, il prodotto finito Ã¨ lento, incompatibile, inutilizzabile. Dâ€™altro canto, se uno scienziato dei dati produce i risultati sbagliati, accorgersene potrebbe non essere una cosa banale. Individuare una frode o un errore in un data set puÃ² essere complicato. Nel corso della Strata Conference, Monica Rogati di LinkedIn ha evidenziato una serie di errori comunemente commessi dagli analisti al momento di interpretare e riportare le proprie ricerche; poichÃ© sempre piÃ¹ persone hanno iniziato a lavorare con i numeri, sono sempre di piÃ¹ coloro che commettono errori. Le statistiche sono spesso contro intuitive (un esempio? Il problema di Monty Hall).

Ãˆ possibile individuare un data set sbagliato, vuoi per malizia, per omissione o per caso? In alcune circostanze si. Plasmare i data set spesso comporta problemi con i dati, e chi si occupa di statistica conosce alcuni trucchi per porvi rimedio. La Legge di Benford, ad esempio, sostiene che â€œin naturaâ€ Ã¨ piÃ¹ probabile che la cifra 1 si presenti con maggior frequenza, poi la cifra 2 e cosÃ¬ via fino a 9. Applicando questa Legge a determinati data set si scoprirÃ quanto Ã¨ probabile che i contenuti siano falsi.

Agiremo di conseguenza?

Lâ€™Open data Ã¨ inutile se non porta allâ€™azione. Molti sostenitori della trasparenza credono che il cambiamento derivi logicamente dalle prove. Le attuali politiche pubbliche governative suggeriscono uno scenario diverso. In merito a questioni critiche di natura globale quali il clima e lâ€™evoluzione, a dispetto di dati schiaccianti e revisionati, siamo ancora bloccati a domandarci se insegnare il creazionismo o se i mutamenti climatici siano reali. Non ci piacciono i numeri fornitici? Basta etichettarli come corrotti, e minacciare di ritirare i fondi. Se lâ€™infografica Ã¨ il nuovo discorso elettorale, mettere in dubbio i dati ne Ã¨ la naturale confutazione.

La semplice trasparenza non porta al cambiamento. Senza un efficace sistema di controlli e verifiche, e senza vere sanzioni, lâ€™abbaglio della cruda luce dei dati non servirÃ a nulla. Questa condizione fa degli avvocati specializzati in class action e degli hacktivisti improbabili alleati: azioni legali, campagne sui social media e boicottaggi spesso rappresentano lâ€™unico modo per indurre il cambiamento in settori altrimenti non regolamentati.

La trasparenza dei dati Ã¨ una corsa alle armi. Nel mondo della divulgazione, alterare i dati Ã¨ come alterare i bilanci. Quanti degli attuali scienziati dei dati diventeranno i periti contabili di domani, impegnati in una guerra alla frode e allâ€™ignoranza? Lâ€™Open data e la trasparenza non sono abbastanza: abbiamo bisogno di True Data (dati reali) e non di Big Data â€“ cosÃ¬ come di legislatori intenzionati ad agire conseguenza.

Ma i dati dicono la veritÃ ?

Come stabilire quando i dati sono sbagliati?

Agiremo di conseguenza?

Articoli correlati

La nuova Carta di Torino: le buone regole per l’informazione medica

Il nuovo codice deontologico delle giornaliste e dei giornalisti in vigore dal 1 giugno 2025

Report 2024 dell’Osservatorio sul giornalismo digitale: alla ricerca del lettore preduto