I Big Data stanno rivoluzionando il nostro modo di vivere
In uno scambio di mail con Lsdi,  Kenneth Cukier, autore con Viktor Mayer-Schonberger di  “Big Data: A Revolution That Will Transform How We Live, Work, and Think”, spiega I dettagli del modo con cui, a suo parere, i Big Data possono “modificare i mercati, le organizzazioni, le relazioni tra i cittadini ed i governiâ€.
Il problema con i Big Data si sposta ora dalla sbandierata privacy al calcolo probabilistico: “un algoritmo potrà prevedere se avremo un infarto, se smetteremo di pagare il mutuo o se potenzialmente saremo nelle condizioni di commettere un atto criminale”. E alle conseguenze nefaste come una carcerazione preventiva basata su un calcolo probabilistico del comportamento umano bisognerà metter fine con una regolazione, “esattamente come l’ esplosione della stampa aprì il campo a leggi che garantivano la libertà d’ espressione”Â
di Daniele Grasso
Nei suoi ultimi anni di vita e cosciente di soffrire di un cancro quasi incurabile, Steve Jobs decise di affidarsi all’ ultima tecnologia disponibile. Pagando una cifra alla portata di pochissimi (una cifra a sei zeri), fu una delle 20 persone al mondo ad ottenere, intera, la propria sequenza genetica. Lo incuriosiva – racconta il suo biografo Walter Isaacson – la possibilità di poter essere sottoposto a terapie che si adattassero alla sua mappa genetica. Anche se non salvò il fondatore di Apple, scomparso nell’ ottobre del 2011, la scelta marcò un punto fondamentale nella lotta contro il cancro: invece di utilizzare solo una piccola parte del DNA, si archiviò un’ enorme quantità dati per racchiudere l’ intera sequenza genetica del paziente.
Secondo Kenneth Cukier (Data editor presso l’  Economist) e Viktor Mayer-Schonberger (professore di Internet Governance and Regulation all’ Universitá di Oxford e opinionista dalle colonne di alcuni dei più prestigiosi media del mondo), questa concezione del mondo, basata sulla raccolta e analisi di grandissime quantità di dati (o Big Data), sta cambiando il nostro modo di vivere quotidiano e non solo gli ultimi giorni di Jobs. Lo raccontano e dimostrano in “Big Data: A Revolution That Will Transform How We Live, Work, and Think” (HMH Books, 2013), di cui Cukier ha spiegato i dettagli in uno scambio di mail con LSDI.
Parlando di Big Data, è difficile farsi un’ idea delle misure di cui si sta parlando. Cukier propone che se fossero registrati su dei CD ed impilati, formerebbero cinque torri dalla terra alla luna. O se fossero stampati e racchiusi in libri, coprirebbero la superficie degli Stati Uniti d’ America con 52 strati. Si tratta comunque solo dell’ informazione che produciamo ogni giorno, la parte paradossalmente meno visibile della società dell’ informazione. Ma a cui stiamo affidando una nuova e rivoluzionaria funzione. Come spiegano gli autori:
“Ci riferiamo a cose che possono essere fatte su grande scala e che non potrebbero esserlo ad una più piccola, con l’ obiettivo di captare nuovi significati o creare nuove forme di valore, in modo da cambiare i mercati, le organizzazioni, le relazioni tra i cittadini ed i governi”.
“Big Data” smise di essere un termine di uso esclusivo della comunità tencologico-scientifica nel 2008. Ci si mise la rivista Wired con un numero sul “diluvio dei dati” caratteristico di una nuova epoca, “l’ era dei PetaByte” (1 Petabyte equivale a 1,024 terabytes, cioé 1 biliardo di bytes) .
Nel 2010, proprio Cukier decise di approfondire il tema:
“Cominciai con una semplice affermazione: ‘la quantità di informazione nel mondo è in costante aumento: ci deve essere qualcosa di nuovo ed interessante nel modo con cui questa informazione viene utilizzata’ “.
Cosà nacque la copertina per The Economist del febbraio del 2010, “The Data Delugeâ€.
In quel numero del settimanale britannico e nel libro ora pubblicato con Mayer, Cukier non fa riferimento solo all’ evoluzione tecnologica che ha permesso di ottenere macchine più potenti e dati più leggibili, ma anche a fonti di dati prima impensabili, perché non predisposte come databases: i canali di comunicazione, le orme lasciate sul Web dagli utenti o gli stessi comportamenti umani. E compagnie come Google e Facebook hanno imparato la lezione ancora prima che il termine si popolarizzasse.
Con questa concezione, nel 2003, Oren Etzioni creó Forecast, pagina web che, incrociando i dati disponibili delle compagnie aeree, poteva individuare il prezzo piú basso per qualunque volo nel mondo, e con largo anticipo. Iniziando con uno “scraping” di 12.000 voli durante 41 giorni, Etzioni, computer scientist statunitense, ottenne la miglior formula (un algoritmo) per prevedere se i prezzi avrebbero teso a diminuire o ad aumentare. E se conveniva, dunque, comprare o aspettare. Senza spiegarne le ragioni (note solo alle compagnie), ma prevedendo il fenomeno. Ed è questa, secondo Cukier e Mayer-Schonberger un’ apporto fondamentale dei Big Data:
“si presta attenzione non al perché, non all’ elucubrazione o all’ intuizione su un fatto, ma a quello che, al fatto in sé che sta accadendo. E questo implica una miglior dimostrazione dei fatti”.
Nel 2012, Microsoft bussó alla porta di Etzioni con un assegno da 110 milioni di dollari. Oggi il sistema di ricerca del miglior prezzo per volare è incorporato al motore di ricerca Bing.
Naturalmente anche Google sa sfruttare l’ enorme quantità di informazione che viene dispersa nella rete. Nel 2009, il BigG riuscà a prevedere nel giro di poche ore la diffusione a livello locale del virus N1H1 a partire dalle ricerche che venivano effettuate nel suo motore di ricerca. Di fatto, prima che il virus si propagasse in una zona, gli scienziati di Google avevano già calcolato quando e in che misura si sarebbe esteso. Un passo da gigante rispetto alle previsioni ufficiali che il Center for Disease Control and Prevention degli USA emetteva ogni due settimane, presentando dunque dati non aggiornati.
È un tipico caso, spiegano gli autori, di “datificazione”:
“oggi si raccolgono dati su ogni accadimento e lo si rende quindi quantificabile, anche quando si tratta di comportamenti umani”.
Â
Ma possono i cittadini comuni controllare i propri dati? Alla domanda, Cukier ci spiega via mail:
 “È complicato per gli utenti poter tener sotto controllo i propri dati. Gran parte di quanto facciamo è raccolto da altri e non esistono strumenti tecnologici che ci permettano di stivare i dati per noi stessi. Magari ci arriveremo, ma per il momento Facebook immagazzina informazioni sui nostri gusti e sulle nostre amicizie, e, anche se non possiamo accedere al magazzino, possiamo vedere i dati. Allo stesso modo Amazon fa tesoro dei dati sulle nostre visite”.
 E gli utenti, per ora, non possono farci nulla:
 “Non possiamo neanche chiedere ai programmatori di applicazioni o ad Apple che ci diano le nostre coordinate GPS che accumulano. Un po’ triste, no? Ma cambierà presto, credo”.
Nonostante ció, assicura Cukier rimandandoci ad un paragrafo del libro, il problema con i Big Data si sposta dalla sbandierata privacy al calcolo probabilistico:
“un algoritmo potrà prevedere se avremo un infarto, se smetteremo di pagare il mutuo o se potenzialmente saremo nelle condizioni di commettere un atto criminale”.
Alle conseguenze nefaste come una carcerazione preventiva basata su un calcolo probabilistico del comportamento umano bisognerà metter fine con una regolazione, “esattamente come l’ esplosione della stampa aprì il campo a leggi che garantissero la libertà d’ espressione”, specifica Cukier.
Non è certo compito dei giornalisti decifrare queste immense quantità di dati, comunque:
“Possiamo richiamare l’ attenzione su un aspetto determinato e proporre possibili rimedi ai problemi che identifichiamo. Ma si tratta di informare e proporre un dibattito alla società “.
Anche l’ uso dei Big Data, come quando in gioco ci fu la vita di Jobs, ha un suo limite.