lunedì, febbraio 13, 2006

I motori di ricerca, la memoria collettiva

Tempo fa stavo guardando la visione del mondo secondo Google, (la chiamo così perché è molto più una weltanschaung che una zeitgeist) e, all'11° posto tra i termini più ricercati appare "Tori Spelling".
Uhm, questo nome non mi giungeva nuovo: che fosse la figlia del famoso produttore di telefilm Aaron Spelling (sapete? Quello di Charlie's angels, Starsky e Hutch, Fantasilandia, Love Boat, Cuore e Batticuore e di altre 100 serie).
Ci clicco sopra e appare una pagina in cui, come primo risultato, compare una poco lusinghiera immagine dell'attrice americana che, senza mutande, suona una batteria. Interessante! Da perfetto voyeur, la clicco e scopro che la pagina che la doveva ospitare non esiste. Ovvero, non esiste più, poichè una volta esisteva, o, per meglio dire, tra i suoi attributi vi era anche quello dell'esistenza.
Mi domando quando avrà dovuto pagare la Spelling per farsi rimuovere
E mi dico anche che Google non può essere corruttibile: una volta apparso nel suo indice, è molto faticoso farsi rimuovere, se non con pagine aventi un PageRank più alto. Ogni giorno migliaia di richieste di rimozione arrivano a Google, ma se il motore di ricerca dovesse esaudirle tutte quante sarebbe costretto a impiegare centinaia di persone solo per queso compito.
Leggetevi cosa afferma Google a proposito:

Richieste di rimozione di collegamenti o di copie cache
Di quando in quando Google riceve richieste di utenti relative alla rimozione di collegamenti dagli indici. Sebbene si riservi il diritto di valutare tali richieste singolarmente, Google tende generalmente ad evadere tali richieste in accordo ai principi indicati di seguito.
Gli indici di Google sono costituiti da informazioni che sono state identificate, indicizzate e compilate tramite una procedura automatica senza alcuna revisione preventiva. Considerata la straordinaria quantità di informazioni regolarmente aggiunte, eliminate e modificate, Google non è in grado e non filtra il contenuto dei propri indici. Google può decidere, caso per caso, di rimuovere singoli siti Web dai propri indici se (i) il proprietario del sito ne limita l'accesso o (ii) se il sito viene rimosso dal Web su richiesta del proprietario stesso o da terzi. Tuttavia, se il gestore del sito non prende le misure necessarie per prevenire l'indicizzazione del sito, è possibile che il sistema di indicizzazione automatica di Google trovi ed includa nuovamente tale sito nei propri indici.
Google archivia molte pagine Web nella propria cache per consentire agli utenti di utilizzare le copie di backup in caso di problemi temporanei sul server. I proprietari dei siti Web possono impedire l'archiviazione delle versioni cache dei loro siti utilizzando il metatag NOARCHIVE. Inoltre, i proprietari dei siti possono richiedere l'immediata rimozione delle versioni cache della pagina dai Servizi di ricerca di Google. Google valuta tali richieste di rimozione individualmente e non garantisce la soddisfazione di ogni richiesta. La procedura necessaria per rimuovere le versioni cache e per impedire che un sito venga salvato nella cache e/o incluso nell'indice è descritta nella sezione Domande frequenti (FAQ) su Google, che può essere selezionata dalla pagina principale di Google.

Google e gli altri motori di ricerca, per merito/colpa della loro cache, diventano quindi una memoria collettiva, nella duplice accezione di "essere della collettività" e di collezionare. Colleziona e non rimuove, non come i siti di cui colleziona il contenuto, e, nel caso venga sollecitato opportunamente, fa apparire cose che parevano/volevano risultare rimosse.
L'esempio che ha scatenato questo articolo è frivolo e misero, ma immaginate cosa potrebbe succedere quando, per sbaglio, incuria o dolo, venissero pubblicate informazioni che non dovrebbero essere divulgate: se nel periodo di permanenza online uno spider di un motore di ricerca riesce a catturarle, ecco combinato il pasticcio.
Ecco quindi un esempio eccellente che poco ha a che vedere col mondo del gossip: nel 2003 Richard Smith, un esperto di tematiche di privacy e sicurezza, trovò delle pagine nella cache di Google tratte da sito dell'Information Awareness Office del Pentagono che erano state rimosse a seguito della pubblicazione di un reportage sullo sviluppo di un sistema informativo dedicato allo spionaggio delle attività dei cittadini americani per l'individuazione di attività terroristiche.

Credo quindi necessaria, da parte dei motori, una politica che accolga con favore e celerità le richieste di rimozione dati dalle cache, quando queste richieste siano ben argomentate; ma anche per chi ha un sito che si evolve frequentemente è necessario un processo di monitoraggio della cache dei motori di ricerca, in modo che il loro contenuto sia coerente con il contenuto delle proprie pagine.
Volete sapere come fare? Mandatemi un'email

Aggiornamento: secondo la giustizia americana la cache di Google non viola le leggi sul copyright. E ci mancherebbe altro.

Stefano Bonacina, da conneXioni

Nessun commento: