Fra 15 anni il 90% delle notizie saranno generate dai computer

Kris Hammond,Â co-fondatore di unâ€™ azienda americana che produce sistemi per la generazione automatica di articoli dai dati, ne Ã¨ convinto â€“ E spiega perchÃ©, indicando in questo articolo tre tendenze in atto: la progressiva quantitÃ di elementi disponibili; la capacitÃ di estrarre dati dalle narrazioni linguistiche; i processi di personalizzazione spinta delle informazioni

—–

di Kris Hammond
(Co-fondatore e responsabile delle tecnologie di Narrative Science)

Quante notizie verranno generate dai computer fra 15 anni, mi era stato chiesto qualche giorno fa? Ero riluttante nel rispondere che dovrebbero essere nell’ ordine del 90%: la mia riluttanza dipendeva dal fatto che mentre per me questo dato era inevitabile, provavo una notevole dose di angoscia nel comunicarlo ai miei interlocutori. Quindi ho pensato che fosse una buona cosa spiegare che cosa significava e per quale motivo io lo ritenevo realistico sulla base dei trend attuali dell’ informazione e della tecnologia.

La disponibilitÃ dei dati

Prima cosa: visto che stiamo parlando di contenuti generati tramite dati e che per una macchina i dati sono meno ambigui di un testo redatto da un uomo, Ã¨ evidente che una delle chiavi del processo sarÃ la disponibilitÃ dei dati stessi. Non c’ Ã¨ nessun dubbio sul fatto che sempre piÃ¹ dati – sport, finanza, immobiliare, governo, affari, politica ecc. – stanno andando online. La tendenza Ã¨ chiara, inarrestabile ed Ã¨ socialmente apprezzabile per chi crede nella trasparenza.

E visto che sono sempre di piÃ¹ le transazioni e le operazioni commerciali ed economiche che avvengono online e vengono registrate, si creano dei nuovi tipi di dati che descrivono il mondo e come esso funziona.

A mano a mano che la tendenza crescerÃ , ci saranno opportunitÃ sempre maggiori di scavare fra questi dati, individuare dei nessi e trasformarli in ”racconti” che possano aiutare i cittadini ad informarsi. Molti dei compiti collegati al giornalismo dei dati come viene fatto ora verranno lasciati alle macchine (sotto il controllo dei redattori) e ci consentiranno di produrre delle storie interessanti su una scala del tutto diversa, determinata appunto dalla grande quantitÃ di dati che rappresentano meglio il nostro mondo.

Questa tendenza riguarda soltanto i dati presi come tali. I dati non sono ambigui e sono leggibili dalle macchine molto meglio delle informazioni testuali, che per ora sono comprensibili solo ai lettori umani. Il mondo delÂ testo leggibile-dallâ€™uomo Ã¨ unâ€™ altra cosa. E questo ci porta alla seconda tendenza.

Tradurre i testi in dati

Su una strada parallela, i sistemi di interpretazione del linguaggio e di estrazione dei dati stanno migliorando a tal punto che gran parte dellâ€™ informazione che al momento Ã¨ leggibile dagli umani ma impenetrabile per i computer verrÃ anchâ€™ essa trasformata in dati; dati che possono essere usati come elementi per la produzione di nuovi racconti.

Questo significa che la descrizione testuale di fatti, incontri di governo, annunci delle imprese, oltre al flusso continuo dei social media, sarÃ processato e trasformato, non tanto da macchine in grado di leggere i testi, quanto da sistemi in grado di rappresentare quello che sta avvenendo nel mondo.

Si tratta di nuovi dati, che saranno integrati con i data base espandibili che sono giÃ a disposizione.
Servizi che giÃ vengono realizzati, come statistiche sportive, prezzi dei mercati, dati sullâ€™ occupazione, ecc., verranno â€˜â€™aumentatiâ€™â€™ e potenziati con informazioni, a loro volta trasformate in dati, sui comportamenti dei compratori fuoricampo, strategie economiche, riunioni amministrative in modo da consentire ai sistemi a guida umana di creare automaticamente storie piÃ¹ ricche, che intrecceranno insieme numeri e vicende.

In piÃ¹, noi continuiamo a ragionare in termini di contenuti in senso generico, di materiali diretti alla gente in generale, limitando cosÃ¬ la portata del processo di creazione dei contenuti. Cosa che introduce un terzo elemento: la scala e la personalizzazione.

Scala e â€˜coda lungaâ€™

Via via che il giornalismo si adatta al nuovo mondo, diventa chiaro che in molti settori câ€™ Ã¨ un bisogno crescente di contenuti piÃ¹ specifici e diretti a audience piÃ¹ ristrette. Questo contenuto piÃ¹ mirato, che avrebbe uno scarso valore a livello di massa, ha un grosso fascino per audience piÃ¹ piccole, di nicchia. Articoli e servizi sugli sport e lâ€™ economia locali, la criminalitÃ , lâ€™ attivitÃ amministrativa saranno interessanti per pubblici ristretti ma per questi ultimi questi contenuti saranno di grande portata informative e di notevole utilitÃ .

Il problema, naturalmente, Ã¨ che questi pubblici sono spesso troppo piccoli per sostenere il tipo di copertura giornalistica di cui avrebbero bisogno. I costi di una copertura dei campionati minori, come la Little League, ad esempio, la rendono impraticabile per una normale redazione. Logisticamente e finanziariamente, Ã¨ impossibile per una testata produrre centinaia di migliaia di articoli, ciascuno dei quali verrebbe poi letto da non piÃ¹ di 50 persone.

Via via che perÃ² i dati diventano disponibili e lâ€™ informatica sviluppa una maggiore comprensione degli eventi, nasce la possibilitÃ di creare contenuti come quelli su grandissima scala. Si tratta di una opportunitÃ sensata, concretamente possibile, attraverso la creazione computerizzata di articoli.

Un computer puÃ² scrivere dei rapporti di cronaca nera altamente localizzati, dei resoconti personalizzati degli andamenti azionari, cronache sportive dei campionati giovanili su una scala tale da poter assicurare una copertura che prima sarebbe stata impossibile e che non sarebbe mai possibile in un mondo di contenuti generati unicamente dagli umani.

Uomo e macchina

Queste tre tendenze messe insieme (ma ce ne sono anche altre) forniscono lâ€™ opportunitÃ di usare i computer per creare in maniera automatica contenuti che possono servire comunitÃ finora del tutto ignorate dal mondo del giornalismo professionale e della produzione di servizi di informazione.

Creando contenuti che integrano i dati giÃ esistenti e fornendo storie di taglio non solo locale, ma addirittura personalizzate, questi sistemi faranno leva su una â€˜â€™coda lungaâ€™â€™ di bisogni e di interesse.

PiÃ¹ ci saranno dati disponibili e piÃ¹ le persone potranno ricevere informazioni rilevanti e di forte carica informativa a livello personale,Â i sistemi cominceranno a produrre su una scala molto maggiore rispetto al â€˜â€™nanismoâ€™â€™ di oggi. PoichÃ© gran parte di questa produzione sarÃ destinata a individui, essa non sarÃ mai troppa, ma potrÃ fornire invece un nuovo tipo di esperienza in cui le notizie sugli avvenimenti del giorno e i fatti internazionali verranno forniti in un contesto personale, che le renderÃ piÃ¹ comprensibili e rilevanti.

Insomma, che fra cinque anni il 90% delle notizie saranno generate dai computer mi sembra non solo ragionevole, ma inevitabile.

Articoli correlati

La nuova Carta di Torino: le buone regole per l’informazione medica

Il nuovo codice deontologico delle giornaliste e dei giornalisti in vigore dal 1 giugno 2025

Report 2024 dell’Osservatorio sul giornalismo digitale: alla ricerca del lettore preduto