Una nuova ricerca mostra quanti collegamenti importanti sul Web si perdono nel tempo

Un quarto dei deep link in Il New York Times’ gli articoli ora sono marci, portando a pagine completamente inaccessibili, secondo un team di ricercatori dalla Harvard Law School, che ha lavorato con il Volte‘team digitale. Hanno scoperto che questo problema interessava oltre la metà degli articoli contenenti collegamenti in ADESSOIl catalogo risale al 1996, che illustra il problema del link rot e quanto sia difficile per il contesto sopravvivere sul web.

Lo studio ha esaminato oltre 550.000 articoli, che contenevano oltre 2,2 milioni di collegamenti a siti Web esterni. È emerso che il 72% di quei link erano “profondi” o puntavano a una pagina specifica piuttosto che a un sito web generico. Com’era prevedibile, ha scoperto che, con il passare del tempo, i collegamenti avevano maggiori probabilità di essere morti: il 6% dei collegamenti negli articoli del 2018 erano inaccessibili, mentre un enorme 72% dei collegamenti del 1998 era morto. Per un esempio recente e diffuso di link rot in pratica, basta guardare cosa è successo quando Twitter ha bandito Donald Trump: tutti gli articoli incorporati nei suoi tweet erano disseminati di scatole grigie.

Una visione inversa del link marciume nel tempo.
Immagine: La Columbia Journalism Review

La squadra ha scelto Il New York Times in parte perché il documento è noto per le sue pratiche di archiviazione, ma non suggerisce il file Volte è tutto così insolito nei suoi problemi di marciume di collegamento. Piuttosto, utilizza la carta dei registri come esempio di un fenomeno che si verifica in tutto Internet. Col passare del tempo, i siti Web che una volta fornivano informazioni preziose, contesto importante o prove di affermazioni controverse tramite collegamenti verranno acquistati e venduti, o semplicemente smetteranno di esistere, lasciando il collegamento a una pagina vuota – o peggio.

Notizie BuzzFeed segnalato nel 2019 sull’industria sotterranea che esiste dove i clienti possono pagare gli operatori di marketing per trovare collegamenti morti in grandi punti vendita come il Volte o il BBC e acquistare il dominio per se stessi. Quindi, possono fare quello che vogliono con il collegamento, come usarlo per pubblicizzare prodotti o per ospitare un messaggio in modo divertente dell’argomento dell’articolo.

Il link rot non influisce solo sul giornalismo. Immagina se quello di Rick Astley Video “Never Gonna Give You Up” è stato eliminato e ricaricato. Ci sarebbero innumerevoli thread di Reddit e risposte ai tweet che non avrebbero più senso per i futuri lettori. Oppure immagina di provare a visualizzare il tuo NFT e scopri che il link di origine ora non punta a nessun luogo. Che incubo!

È stato fatto del lavoro nel tentativo di preservare i collegamenti. Wikipedia, ad esempio, chiede che i contributori scrivano citazioni fornire un collegamento all’archivio di una pagina su siti come Wayback Machine se pensano che un articolo possa cambiare. C’è anche il file Progetto Perma.cc, che tenta di risolvere il problema della decomposizione dei collegamenti nelle citazioni legali e nelle riviste accademiche fornendo una versione archiviata della pagina, insieme a un collegamento alla fonte originale.

È improbabile, tuttavia, che un’infarinatura di progetti simili là fuori possa risolvere il problema per l’intero Internet, compresi i social network, o anche solo per i giornalisti. Fino a quando non troveremo una soluzione, gli articoli continueranno a perdere sempre più contesto col passare del tempo. Un esempio perfetto: il nostro articolo sul marciume dei link del 2012 ha un link di origine a The Chesapeake Digital Preservation Group, che ora porta a una pagina 404.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *