mercoledì 12 giugno 2024

Il club degli articoli cancellati dai motori di ricerca

Esiste un sito che tiene traccia dei tanti link che le testate giornalistiche fanno scomparire dai motori di ricerca. E dimostra quante informazioni sulle vicende del passato diventano molto difficili da individuare.

Chi fa una ricerca su Internet si aspetta che gli venga restituita una fotografia più o meno completa e soddisfacente della realtà su cui sta interrogando il motore di ricerca. Ma in realtà le cose non stanno così: negli ultimi anni soprattutto gli articoli dei giornali hanno iniziato a dissolversi e non venire più mostrati all’utente. Non compaiono sui motori di ricerca – Google è in assoluto il più diffuso – e se ne perde la loro utilità sostanziale, cioè quella di saltar fuori dal monitor in correlazione a quello che l’utente chiede. 

Questo avviene per effetto della “deindicizzazione”, che in buona sostanza consiste nel rimuovere un articolo dalle conoscenze di Google così come fosse un indirizzo cancellato dall’elenco telefonico. La strada, il civico e il numero di telefono rimangono lì, ci mancherebbe. 
Ma nessuno può conoscerli a meno di non sapere esattamente dove si trovano ...


La deindicizzazione non avviene per errore, ma quasi sempre per tutelare una persona citata in quegli articoli. 

Un individuo può chiedere a Google che a una data ricerca (il proprio nome e cognome ad esempio) non venga più mostrato uno specifico contenuto. L’articolo è dunque ancora reperibile, ma semplicemente Google lo omette.

In altri casi a deindicizzare un articolo è direttamente la testata che l’ha pubblicato, tramite un comando nascosto nel proprio sito nel quale si dice ai motori di ricerca che passano di lì di «circolare, qui non c’è niente da leggere». Gli articoli sono online, quindi, ma gli utenti non li possono trovare dai motori di ricerca e devono sapere esattamente in quale sito si trovano. 

I motivi per cui il proprietario di un sito, testate online comprese, decide di deindicizzare un contenuto sono vari. I due più frequenti: per effettuare test su alcune pagine oppure perché aziende o persone fisiche hanno invocato il diritto all’oblio, cioè la possibilità di essere dimenticati dal momento che la vicenda che li riguarda è lontana del tempo e ha perso interesse pubblico.

Se nel caso della deindicizzazione imposta dai motori di ricerca è sempre più difficile conoscere l’indirizzo dell’articolo colpito dalla censura, dall’altra l’elenco dei contenuti che le testate scelgono volontariamente di deindicizzare è aperto e leggibile a tutti, proprio per permettere a Google di cercarlo in autonomia. 


È nato così il sito canzel.club, il club dei cancellati, che si occupa di monitorare le pagine omesse da alcuni giornali italiani ed esteri in modo da misurare il grado di autocensura della stampa. 

L’ha creato lo sviluppatore Sowdust nel 2021 e da allora monitora la deindicizzazione di molte testate giornalistiche italiane come La Stampa, Repubblica, il Corriere della Sera e Rai.it, e internazionali, tra cui El Pais e il Washington Post.

Il sito canzel.club è programmato per leggere un file che si trova all’interno delle testate monitorate, robots.txt, il quale comunica con i motori di ricerca e dà indicazione su quali pagine non devono essere indicizzate. Ogni volta che il file robots.txt delle testate giornalistiche monitorate viene aggiornato con un nuovo contenuto da rendere invisibile, canzel.club inserisce l’url dell’articolo al suo elenco.

Grafico: IrpiMedia • Apr 2024 - Fonte: canzel.club - Scaricare i dati - Creato con Datawrapper

«Canzel.club nasce dall'idea di sfruttare il file robots.txt per l'uso opposto a quello per cui è stato pensato - spiega Sowdust -. 
Le testate giornalistiche lo usano come una lista di url da ignorare, canzel.club invece lo usa per evidenziare gli articoli che nel tempo i giornali hanno deciso di rendere introvabili tramite i motori di ricerca» commenta lo sviluppatore a IrpiMedia.


«Non esiste un sistema di tracciamento delle deindicizzazioni, né tantomeno sono note le motivazioni per cui avvengono - prosegue Sowdust -. Con canzel.club è possibile osservare almeno in parte cosa scompare rispettando il diritto all'oblio, in quanto il sito e i suoi contenuti sono a loro volta nascosti ai motori di ricerca». 

Deindicizzare o non deindicizzare? Questo è il problema

Il penalista dell'informatica e delle nuove tecnologie Giovanni Battista Gallus spiega che per un giornalista ci sono due diversi «trattamenti» di un dato personale: «Quello per finalità di cronaca, che legittima la pubblicazione di un fatto su un giornale, quello per finalità di ricerca (anche statistica e storica), che si materializza nell’archivio storico del giornale».

Esiste poi un terzo trattamento, appannaggio dei motori di ricerca che rendono cercabili i contenuti agli utenti della rete. 

Se qualcuno ritiene che la permanenza online di un contenuto sia dannosa perché offre un’informazione vecchia e superata nei suoi riguardi, può chiedere la deindicizzazione sia alla testata sia al motore di ricerca. 

Il diritto all’oblio andrebbe però bilanciato con il valore informativo di ciò che è contenuto nell’articolo. Nel caso in cui questo sia elevato, «è bene aggiornare e non cancellare un articolo di stampa, se c’è la possibilità» spiega a IrpiMedia Bruno Saetta, avvocato ed esperto di diritto applicato alle nuove tecnologie.

Un esempio classico è quello degli articoli che riportano una vicenda giudiziaria: nel caso di un’assoluzione, piuttosto che rimuovere per intero l’articolo sarebbe quindi meglio dare evidenza dell’esito del processo con un aggiornamento all’articolo stesso. 
Soprattutto se i protagonisti della storia sono personaggi di rilievo pubblico. 

Il problema è sempre riuscire a trovare «un bilanciamento tra l’interesse pubblico e quello di una persona di essere dimenticata», aggiunge Saetta.

«Come dimostrano alcuni provvedimenti del Garante per la protezione dei dati personali, Google tende a resistere di più alle richieste di deindicizzazione - commenta l’avvocato Giovanni Battista Gallus -. È più facile che sia una testata a rendere irraggiungibile un articolo» rispetto al motore di ricerca. 
Lo si deduce, spiega l’avvocato, dal fatto che il Garante in diversi provvedimenti «dichiara esplicitamente il non luogo a procedere perché l’articolo è già stato deindicizzato prima che la persona faccia reclamo all’Autorità».

Significa quindi che un testata, quando ne ha ricevuto richiesta da una persona interessata, ha deciso di rendere irraggiungibile ai motori di ricerca un articolo prima di avere un (eventuale, non necessario) parere di merito dall’Autorità preposta. «A volte è stato addirittura rimosso dall'archivio storico», conclude Gallus.

Per maggiori informazioni continua qui: irpimedia.irpi.eu

Nessun commento:

Posta un commento

Nota. Solo i membri di questo blog possono postare un commento.