В сети гуляет поговорка «Все, что попало в интернет, остается в нем навсегда». Журналисты газеты The Independent со ссылкой на исследование, опубликованное аналитической компанией Pew Research Center, развеяли миф о «бессмертии» глобальной сети.
Эксперты выяснили, что 38% веб-страниц, существовавших в 2013 году, в настоящее время потеряны. Исчезают и относительно новые страницы — 8% веб-страниц, существовавших в 2023 году, уже недоступны в первой половине 2024-го.
Что еще выяснили аналитики об исчезновении интернета?
- У 21% сайтов правительства существуют ссылки, которые никуда не ведут;
- В 54% статьях «Википедии» есть ссылки, которых больше не существует;
- В 23% новостных сайтах есть «мертвые» ссылки.
Подобная тенденция замечена и в социальных сетях. Например, каждый пятый пост в X(Twitter) исчезает в течение нескольких месяцев после публикации. Почти 60% новых приватных аккаунтов в соцсетях удаляются в течение года.
Для проведения исследования использовался открытый репозиторий данных веб-сканирования Common Crawl. Он архивирует миллиарды веб-страниц и предоставляет архивы и наборы данных для публичного использования. Аналитики случайным образом выбрали более 1 млн веб-страниц, прежде чем проверить ссылки, чтобы определить, какие из них все еще активны, а какие ушли в огромный архив потерянной информации.
Было установлено, что 25% всех страниц, собранных в период с 2013 по 2023 год, больше не были доступны. Из них 16% ссылок находились в веб-сайтах, которые продолжали работать, а 9% были размещены на веб-сайтах, которые больше не существуют.
Эксперты бьют тревогу
Другое исследование, проведенное в этом году, доказало, что 46,9% всего интернет-трафика принадлежит ботам, которые могут генерировать и продвигать всевозможную вымышленную информацию.
Во времена такого «беспорядка» появились ИИ-алгоритмы и нейросети, которым нужно учиться, поглощая огромные объемы данных. Так как ложных данных в сети становится все больше, ИИ могут врать, глючить и выдумывать несуществующие факты. Так, например, произошло с ИИ-поиском от Google, который рекомендовал людям добавлять клей в пиццу. Позже выяснилось, что ИИ принял сарказм человека из Reddit за реальный совет и продвинул его в первые строчки поисковика.
Потеря ценной информации из сети, конечно, не идет на пользу людям и ИИ. Получается так, что новая информация становится более сомнительной, а старую, но достоверную, становится все труднее найти.
Ранее в сети даже появился новый термин «слоп». Этим словом обозначают странный ИИ-контент в сети, который не несет никакой пользы.