Майже половина інтернету вже померла: вивчено мільйон веб-сторінок

Читать на русском

Згідно з новим звітом, багато веб-сайтів зникли, що є частиною процесу, званого цифровим розпадом

Читать на русском
Google та інтернет
Веб-сторінки можуть "занепадати" з плином часу, і новий звіт показує масштаби цього цифрового явища

Згідно з новим звітом, багато веб-сайтів зникли, що є частиною процесу, званого цифровим розпадом

Аналітики Pew Reasearch з'ясували, що контент сайтів, створений нещодавно, існує нетривалий час. Аналіз виявив, що чверть усіх веб-сторінок, які існували в певний момент між 2013 і 2023 роками, більше не доступні. Найчастіше це пов'язано або з коригуванням сайтів, або з їх повним видаленням.

Новий аналіз не тільки не є незабутнім творінням, а й демонструє, наскільки насправді швидкоплинний онлайн-контент, пише IFLScience. Цифровий розпад - це поступова деградація, пошкодження або застарівання цифрової інформації з плином часу.  

Дослідники проаналізували майже 1 мільйон веб-сторінок з архівів служби Common Crawl, яка збирає скріншоти сторінок в Інтернеті в різні часові проміжки. Вони зібрали цю інформацію за період з 2013 по 2023 рік, а потім перевірили, чи існують ці сторінки.

Близько 25% сторінок, створених у цей період, більше не були доступні станом на жовтень 2023 року. Ця сума складається з двох типів неіснуючого контенту: 16% сторінок були "індивідуально недоступні", але перебували в інших доступних кореневих доменах. Проте інші 9% були недоступні, оскільки весь кореневий домен більше не існував.

38% веб-сторінок, які існували у 2013 році, вже не доступні, а минуло лише 10 років
38% веб-сторінок, які існували у 2013 році, вже не доступні, а минуло лише 11 років

"Не дивно, що на старих знімках нашої колекції була найбільша частка недоступних посилань", - пояснили автори звіту.

До кінця 2023 року 38% сторінок, зібраних у знімку 2013 року, зникли. Але навіть зміст знімка 2021 року постраждав від цього руйнування: приблизно кожна п'ята сторінка була втрачена.

Крім того, було отримано цікаві порівняльні результати для різних типів веб-сторінок. Наприклад, під час аналізу було вивчено довідкові посилання на 50 000 англомовних сторінок Вікіпедії. Дослідники виявили, що 82% обраних сторінок мали принаймні одне довідкове посилання, яке переводило користувачів на сторінки, що не стосуються Вікіпедії, однак 11% "усіх посилань, пов'язаних із Вікіпедією", більше не доступні.

Аналіз новинних сайтів показав, що 23% веб-сторінок містять хоча б одне неробоче посилання, те ж саме стосується 21% урядових сайтів. Особливо часто непрацюючі посилання зустрічаються на сайтах місцевих органів влади.

Цифровий занепад проявляється і в соціальних мережах. Майже кожен п'ятий твіт більше не відображається у відкритому доступі на сайті через кілька місяців після публікації. 60% акаунтів, які опублікували твіт, ставали приватними, або їхня дія припинялася, або обліковий запис видалявся. В інших 40% випадків користувачі самі видаляли твіт, але профіль продовжував існувати.

Автори також виявили, що твіти особливо схильні до зникнення або видалення, якщо вони були написані певними мовами. Наприклад, половина всіх твітів турецькою мовою і менша частина твітів арабською мовою більше не доступні. Загалом, більшість "твітів, видалених із сайту, як правило, зникають незабаром після публікації".

Підписуйтесь на наш Telegram-канал, щоб не пропустити важливих новин. Підписатися на канал у Viber можна тут.

ЧИТАЙТЕ ТАКОЖ:

Ми використовуємо файли cookie, щоб забезпечити належну роботу сайту, а вміст та реклама відповідали Вашим інтересам.