Согласно новому отчету, многие веб-сайты исчезли, что является частью процесса, называемого цифровым распадом
Аналитики Pew Reasearch выяснили, что контент сайтов, созданный недавно, существует непродолжительное время. Анализ показал, что четверть всех веб-страниц, которые существовали в определенный момент между 2013 и 2023 годами, больше не доступны. Чаще это связано либо с корректировкой сайтов, либо с их полным удалением.
Новый анализ не только не является незабываемым творением, но и демонстрирует, насколько действительно быстротечен онлайн-контент, пишет IFLScience. Цифровой распад - это постепенная деградация, повреждение или устаревание цифровой информации с течением времени.
Исследователи проанализировали почти 1 миллион веб-страниц из архивов службы Common Crawl, собирающей скриншоты страниц в Интернете в разные временные рамки. Они собрали эту информацию за период с 2013 по 2023 год, а затем проверили, существуют ли эти страницы.
Около 25% страниц, созданных в этот период, больше не были доступны по состоянию на октябрь 2023 года. Эта сумма состоит из двух типов несуществующего контента: 16% страниц были индивидуально недоступны, но находились в других доступных корневых доменах. Однако остальные 9% были недоступны, поскольку весь корневой домен больше не существовал.
"Неудивительно, что на старых снимках нашей коллекции была самая большая часть недоступных ссылок", - объяснили авторы отчета.
К концу 2023 года 38% страниц, собранных в снимке 2013 года, исчезли. Но даже содержание снимка 2021 года пострадало от этого разрушения: примерно каждая пятая страница была утрачена.
Кроме того, были получены интересные сравнительные результаты для разных типов веб-страниц. Например, при анализе были изучены справочные ссылки на 50 000 англоязычных страниц Википедии. Исследователи обнаружили, что 82% избранных страниц имели по крайней мере одну справочную ссылку, которая переводила пользователей на страницы, не относящиеся к Википедии, однако 11% "всех ссылок, связанных с Википедией", больше не доступны.
Анализ новостных сайтов показал, что 23% веб-страниц содержат хотя бы одну нерабочую ссылку, то же касается 21% правительственных сайтов. Особенно часто неработающие ссылки встречаются на сайтах местных органов власти.
Цифровой упадок проявляется и в социальных сетях. Почти каждый пятый твит больше не отображается в открытом доступе через несколько месяцев после публикации. 60% аккаунтов, опубликовавших твит, становились частными, либо их действие прекращалось, либо аккаунт удалялся. В остальных 40% случаев пользователи сами удаляли твит, но профиль продолжал существовать.
Авторы также обнаружили, что твиты особенно склонны к исчезновению или удалению, если они были написаны на определенных языках. Например, половина всех твитов на турецком языке и меньшая часть твитов на арабском языке больше не доступны. В целом большинство "твитов, удаленных с сайта, как правило, исчезают вскоре после публикации".
Подписывайтесь на наш Telegram-канал, чтобы не пропустить важные новости. Подписаться на канал в Viber можно здесь.