Il problema della qualitÃ nellâ€™ informazione digitale

I responsabili dellâ€™ aggiornamento dellâ€™ algoritmo di Google che gestisce le classifiche dei risultati delle ricerche e il ranking dei siti web spiegano i criteri con cui Ã¨ stato messo a punto il meccanismo di rivalutazione della qualitÃ dei contenuti â€“ Intanto dalle esperienze compiute dopo lâ€™ applicazione dellâ€™ aggiornamento il dibattito ha fatto emergere una serie di indicazioni per risalire nelle classifiche â€“ Contenuti di bassa qualitÃ , in particolare, possono provocare la perdita di posti di classifica per lâ€™ intero sito

————

Che cos’ Ã¨ la qualitÃ nella produzione di cointenuti di siti web? In alcuni casi â€“ vedi le cosiddette â€˜â€™content farmâ€™â€™, le fabbriche di contenuti â€“ si arriva alla soglia dello spam: come definire questa soglia? Come determinare che un sito Ã¨ superificiale e produce contenuti di bassa qualitÃ ?

Google ha cercato di mettere a punto un meccanismo empirico che desse una risposta a questi interrogativi. Ne aveva bisogno per far partire l’ operazione ”Pandaâ€™â€™ (Ã¨ solo il nome di un ingegnere di Mountain View), Â quel complesso aggiornamento del suo motore di ricerca che ha interessato quasi il 12% dei risultati delle ricerche, come racconta Davide â€˜â€™Tagliaerbaâ€™â€™ Pozzi nel suo omonimo blog.

Lâ€™ operazione puntava a ridimensionare le classificazione dei siti con contenuti di bassa qualitÃ , che riuscivano perÃ² a posizionarsi meglio dei siti con contenuti qualitativamente superiori, e a consentire la giusta classifica dei siti apprezzati invece per la qualitÃ dei loro contenuti. Il tutto fra molte polemiche, naturalmente.

Il meccanismo Ã¨ stato spiegato bene qualche giorno fa da Amit Singhal e Matt Cutts, i due responsabili del progetto, in una intervista a Wired, di cui Tagliaerbe riporta alcuni passi.

W.: Come fate a riconoscere un sito con contenuti superficiali? Potete dare una definizione di contenuti di bassa qualitÃ ?

A.S.: Questo Ã¨ un problema molto, molto difficile che cerchiamo di risolvere, e siamo in una continua evoluzione per cercare di farlo. Abbiamo voluto mantenere un approccio rigorosamente scientifico, e quindi abbiamo usato il sistema di valutazione standard che abbiamo sviluppato, dove in pratica inviamo i documenti a dei tester esterni. A queste persone abbiamo posto domande del tipo: â€œTi fideresti a dare il tuo numero di tua carta di credito a questo sito? Ti fideresti a dare le medicine prescritte da questo sito ai tuoi figli?â€

M.C.: Un ingegnere ha preparato un set di domande molto rigorose, del tipo â€œConsideri autorevole questo sito? Sarebbe OK se questo sito fosse una rivista? Questo sito ha un numero eccessivo di annunci pubblicitari?â€ e cosÃ¬ via.

A.S.: Sulla base di questo, abbiamo fondamentalmente definito cosa puÃ² essere considerato di bassa qualitÃ . Inoltre abbiamo lanciato il Chrome Site Blocker, ma non abbiamo utilizzato i dati raccolti per questo update. Tuttavia, confrontando tali dati, abbiamo notato un 84% di sovrapposizione, che ci ha fatto capire che siamo nella giusta direzione.

W.: Ma come avete implementato questa cosa algoritmicamente?

M.C.: Penso che lâ€™ingegnere cerca di riportare la sua stessa intuizione e la sua stessa â€œexperienceâ€ agli utenti. Ogni volta che guardiamo ai siti che abbiamo bloccato, grazie alla nostra intuizione e alla nostra esperienza, cerchiamo di capire se questa cosa sarÃ o meno di valore per lâ€™utente. E attualmente lâ€™idea Ã¨ quella di classificare i siti di alta qualitÃ da una parte, e quelli di bassa qualitÃ dallâ€™altra.

A.S.: Immagina un iperspazio con un sacco di puntini: alcuni rossi, altri verdi, altri mischiati. Il nostro compito Ã¨ trovare un piano che ci dica che la maggior parte delle cose che stanno da un lato sono rosse, e la maggior parte delle cose che stanno sullâ€™altro lato sono lâ€™opposto del rosso.

(….)

M.C.: In un certo senso, quando la gente va su Google Ã¨ esattamente quello che chiede â€“ un giudizio editoriale. E questo Ã¨ espresso tramite un algoritmo. Quando qualcuno va su Google, lâ€™unico modo per essere neutrali Ã¨ di mostrare i link a caso, oppure in ordine alfabetico. Il punto cruciale Ã¨ che dobbiamo avere la possibilitÃ di modificare la classificazione delle cose, per migliorare il motore di ricerca.

W.: Alcuni dicono che dovreste essere trasparenti, per dimostrare che non fate questi algoritmi per agevolare gli inserzionisti.

A.S.: Posso dire categoricamente che non sono i soldi a impattare sulle nostre decisioni.

—

Ma cosa deve fare un sito colpito dal Google Panda Update per riguadagnare le posizioni perse allâ€™interno dei risultati del motore di ricerca? Dopo lâ€™ iniziativa della casa di Montain View, molti webmaster stanno discutendo del problema.

In sintesi, secondo Taglaerbe, si possono ricavare alcune lezioni:

â€¢ contenuti di qualitÃ sostanzialmente bassa possono causare la perdita di ranking dellâ€™intero sito (anche se questo ha pagine di alta qualitÃ )
â€¢ cerca le pagine di bassa qualitÃ (non utili, scritte male, duplicate o inconsistenti) e rimuovile
â€¢ lâ€™esperienza complessiva dellâ€™utente Ã¨ importante: design, usabilitÃ , rapporto fra pubblicitÃ e contenuti, percezione del brand
â€¢ verifica sia i contenuti che il template del sito (Ã¨ un template che inserisce un sacco di pubblicitÃ nelle pagine? viene mostrata allâ€™utente unâ€™interfaccia scadente?)
â€¢ una volta che sei certo che i contenuti sono di alta qualitÃ , poni attenzione a engagement e awareness (attraverso i social media e altri canali)
â€¢ diversifica in vari canali e persino allâ€™interno della ricerca, guarda al di lÃ della web search verso Google News e i risultati â€œone boxâ€ come blog, immagini e video
â€¢ possiamo imparare qualcosa dalle content farm, in particolare il loro modo di individuare ciÃ² che interessa al pubblico e le risposte che vogliono dare, nonchÃ© le tecniche che utilizzano per sfruttare il crowdsourcing

Il messaggio ufficiale di Google, insomma, Ã¨ questo: contenuti di bassa qualitÃ su una parte del sito possono impattare sul posizionamento di tutto il sito.

E quindi Ã¨bene cercare ed eliminare quelle parti.

Articoli correlati

Il nuovo codice deontologico delle giornaliste e dei giornalisti in vigore dal 1 giugno 2025

Report 2024 dell’Osservatorio sul giornalismo digitale: alla ricerca del lettore preduto

I principi globali per l’intelligenza artificiale per garantire un futuro sostenibile dell’editoria e del giornalismo