Почти половина интернета уже умерла: изучен миллион веб-страниц

Согласно новому отчету, многие веб-сайты исчезли, что является частью процесса, называемого цифровым распадом

Google и интернет
Веб-страницы могут "приходить в упадок" с течением времени, и новый отчет показывает масштабы этого цифрового явления

Аналитики Pew Reasearch выяснили, что контент сайтов, созданный недавно, существует непродолжительное время. Анализ показал, что четверть всех веб-страниц, которые существовали в определенный момент между 2013 и 2023 годами, больше не доступны. Чаще это связано либо с корректировкой сайтов, либо с их полным удалением.

Новый анализ не только не является незабываемым творением, но и демонстрирует, насколько действительно быстротечен онлайн-контент, пишет IFLScience. Цифровой распад - это постепенная деградация, повреждение или устаревание цифровой информации с течением времени.  

Исследователи проанализировали почти 1 миллион веб-страниц из архивов службы Common Crawl, собирающей скриншоты страниц в Интернете в разные временные рамки. Они собрали эту информацию за период с 2013 по 2023 год, а затем проверили, существуют ли эти страницы.

Около 25% страниц, созданных в этот период, больше не были доступны по состоянию на октябрь 2023 года. Эта сумма состоит из двух типов несуществующего контента: 16% страниц были индивидуально недоступны, но находились в других доступных корневых доменах. Однако остальные 9% были недоступны, поскольку весь корневой домен больше не существовал.

38% веб-страниц, которые существовали в 2013 году, уже не доступны, а прошло всего 10 лет
38% веб-страниц, которые существовали в 2013 году, уже не доступны, а прошло всего 11 лет

"Неудивительно, что на старых снимках нашей коллекции была самая большая часть недоступных ссылок", - объяснили авторы отчета.

К концу 2023 года 38% страниц, собранных в снимке 2013 года, исчезли. Но даже содержание снимка 2021 года пострадало от этого разрушения: примерно каждая пятая страница была утрачена.

Кроме того, были получены интересные сравнительные результаты для разных типов веб-страниц. Например, при анализе были изучены справочные ссылки на 50 000 англоязычных страниц Википедии. Исследователи обнаружили, что 82% избранных страниц имели по крайней мере одну справочную ссылку, которая переводила пользователей на страницы, не относящиеся к Википедии, однако 11% "всех ссылок, связанных с Википедией", больше не доступны.

Анализ новостных сайтов показал, что 23% веб-страниц содержат хотя бы одну нерабочую ссылку, то же касается 21% правительственных сайтов. Особенно часто неработающие ссылки встречаются на сайтах местных органов власти.

Цифровой упадок проявляется и в социальных сетях. Почти каждый пятый твит больше не отображается в открытом доступе через несколько месяцев после публикации. 60% аккаунтов, опубликовавших твит, становились частными, либо их действие прекращалось, либо аккаунт удалялся. В остальных 40% случаев пользователи сами удаляли твит, но профиль продолжал существовать.

Авторы также обнаружили, что твиты особенно склонны к исчезновению или удалению, если они были написаны на определенных языках. Например, половина всех твитов на турецком языке и меньшая часть твитов на арабском языке больше не доступны. В целом большинство "твитов, удаленных с сайта, как правило, исчезают вскоре после публикации".

Подписывайтесь на наш Telegram-канал, чтобы не пропустить важные новости. Подписаться на канал в Viber можно здесь.

ЧИТАЙТЕ ТАКЖЕ:

Главная Актуально Informator.ua Україна на часі Youtube