Новое исследование доказало, что интернет исчезает

Четверть всех веб-страниц, выпущенных 10 лет назад, становится недоступной.
Новое исследование доказало, что интернет исчезает
Источник: Unsplash

В сети гуляет поговорка «Все, что попало в интернет, остается в нем навсегда». Журналисты газеты The Independent со ссылкой на исследование, опубликованное аналитической компанией Pew Research Center, развеяли миф о «бессмертии» глобальной сети.

Эксперты выяснили, что 38% веб-страниц, существовавших в 2013 году, в настоящее время потеряны. Исчезают и относительно новые страницы — 8% веб-страниц, существовавших в 2023 году, уже недоступны в первой половине 2024-го.

Что еще выяснили аналитики об исчезновении интернета?

  • У 21% сайтов правительства существуют ссылки, которые никуда не ведут;
  • В 54% статьях «Википедии» есть ссылки, которых больше не существует;
  • В 23% новостных сайтах есть «мертвые» ссылки.
Источник: Pew Research Center
Источник: Pew Research Center

Подобная тенденция замечена и в социальных сетях. Например, каждый пятый пост в X(Twitter) исчезает в течение нескольких месяцев после публикации. Почти 60% новых приватных аккаунтов в соцсетях удаляются в течение года.

Для проведения исследования использовался открытый репозиторий данных веб-сканирования Common Crawl. Он архивирует миллиарды веб-страниц и предоставляет архивы и наборы данных для публичного использования. Аналитики случайным образом выбрали более 1 млн веб-страниц, прежде чем проверить ссылки, чтобы определить, какие из них все еще активны, а какие ушли в огромный архив потерянной информации.

Было установлено, что 25% всех страниц, собранных в период с 2013 по 2023 год, больше не были доступны. Из них 16% ссылок находились в веб-сайтах, которые продолжали работать, а 9% были размещены на веб-сайтах, которые больше не существуют.

Эксперты бьют тревогу

Другое исследование, проведенное в этом году, доказало, что 46,9% всего интернет-трафика принадлежит ботам, которые могут генерировать и продвигать всевозможную вымышленную информацию.

интернет
Источник: Unsplash

Во времена такого «беспорядка» появились ИИ-алгоритмы и нейросети, которым нужно учиться, поглощая огромные объемы данных. Так как ложных данных в сети становится все больше, ИИ могут врать, глючить и выдумывать несуществующие факты. Так, например, произошло с ИИ-поиском от Google, который рекомендовал людям добавлять клей в пиццу. Позже выяснилось, что ИИ принял сарказм человека из Reddit за реальный совет и продвинул его в первые строчки поисковика.

Потеря ценной информации из сети, конечно, не идет на пользу людям и ИИ. Получается так, что новая информация становится более сомнительной, а старую, но достоверную, становится все труднее найти.

Ранее в сети даже появился новый термин «слоп». Этим словом обозначают странный ИИ-контент в сети, который не несет никакой пользы.