Una nuova ricerca del Pew Research Center con sede negli Stati Uniti ha rilevato che quasi il 40% di tutte le pagine web create nel 2013 non sono più accessibili a causa di un fenomeno chiamato “decadimento digitale”.
Se stai cercando un articolo online del 2013, è possibile che sia scomparso.
Una nuova ricerca del Pew Research Center negli Stati Uniti conclude che il 38% di tutte le pagine web esistenti nel 2013 non sono più accessibili a causa di un fenomeno chiamato “decadimento digitale”.
Estendendo l’orizzonte temporale, i ricercatori hanno scoperto che circa un quarto di tutte le pagine web create dal 2013 al 2023 non esistono più. Di questi, l’8% è stato creato nel 2023.
“Internet è un deposito inimmaginabilmente vasto della vita moderna… ma anche se gli utenti di tutto il mondo fanno affidamento sul web per accedere a libri, immagini, articoli di notizie e altre risorse, questi contenuti a volte scompaiono alla vista”, si legge nello studio.
La ricerca ha definito collegamenti inaccessibili come una pagina che non esiste più su un server host (mostrando un messaggio 404 non trovato).
I ricercatori hanno raccolto un campione casuale di pagine web da Common Crawl, una ricerca negli archivi Internet che scatta un’istantanea di come appare Internet in un dato momento.
Il team ha campionato circa 90.000 pagine Internet all’anno dal 2013 al 2023 per vedere se esistono ancora.
Su Wikipedia hanno scoperto che circa il 54% delle pagine analizzate presentavano almeno un collegamento interrotto nella sezione dei riferimenti.
Circa il 23% dei siti di notizie conteneva un collegamento non funzionante, mentre il 21% delle pagine governative lo conteneva.
I ricercatori hanno esaminato più da vicino i siti governativi e hanno scoperto che la pagina web media conteneva 50 collegamenti, spesso per proteggere le pagine HTTP per ulteriori informazioni.
Dei quattro livelli di governo, le amministrazioni comunali sono quelle che hanno maggiori probabilità di avere collegamenti interrotti, con il 29% dei siti esaminati che presentano almeno un collegamento interrotto.
Per quanto riguarda il settore dell’informazione, hanno trovato all’incirca la stessa quantità di pagine con collegamenti interrotti su siti con traffico elevato e basso e, come i siti governativi, la maggior parte collegati a siti Web esterni HTTP protetti.
Il decadimento si sta verificando anche sui social media, dove poco meno di un post su cinque su X (ex Twitter) raccolto in un campione casuale in tempo reale di 4,8 milioni di post non è stato disponibile per più di qualche mese sul sito, sia perché un utente l’account è stato eliminato o il singolo post è stato rimosso.
Un post su X aveva maggiori probabilità di scomparire se era scritto in turco o arabo o proveniva da un account con “impostazioni predefinite” come un’immagine del profilo generica o una biografia.
Image:Getty Images