Cloudflare создала новый инструмент для защиты от ботов: как он работает

Вместо блокировки ботов система затягивает их в бесконечный лабиринт сгенерированного контента, расходуя их ресурсы.
Автор новостей
художественное представление о работе нового инструмента Cloudflare
Визуализация работы нового инструмента CloudflareИсточник: Cloudflare

Компания Cloudflare представила AI Labyrinth — инструмент для противодействия автоматическим сканерам, которые собирают данные сайтов без разрешения. В отличие от традиционных методов, которые просто блокируют ботов, новый подход использует ловушки с фальшивыми страницами, вынуждая их тратить вычислительные мощности впустую.

Когда система обнаруживает подозрительную активность, она перенаправляет бота на серию специально созданных страниц. Эти страницы выглядят реалистично, но не содержат полезной информации. В результате алгоритмы тратят время на обработку бессмысленного контента, что снижает эффективность их работы.

Почему блокировка не всегда эффективна

Обычные способы защиты сайтов от скрейпинга, такие как запрет в файле robots.txt или блокировка IP-адресов, могут сигнализировать ботам, что они обнаружены. В ответ злоумышленники адаптируют свои алгоритмы и обходят ограничения. AI Labyrinth решает эту проблему иначе — он не останавливает бота сразу, а заставляет его взаимодействовать с бесполезным контентом, тем самым истощая ресурсы.

символы в стиле «Матрицы» на ноутбуке
Визуализация хакерской атаки на ноутбукИсточник: Unsplash

Как создаются ловушки для ИИ

Фальшивые страницы формируются с помощью Cloudflare Workers AI. Это облачная платформа, способная генерировать тексты, которые выглядят как реальные статьи, но не имеют отношения к защищаемому сайту. Они могут содержать случайные научные факты или нейтральную информацию, чтобы не распространять ложные сведения.

Такие страницы недоступны обычным пользователям и не индексируются поисковыми системами. Они созданы исключительно для взаимодействия с ботами. Если бот переходит по нескольким подобным ссылкам подряд, Cloudflare фиксирует его как злоумышленника и использует полученные данные для дальнейшего улучшения защиты.

пример структуры лабиринта
ЛабиринтИсточник: Unsplash

Масштабы проблемы и перспективы развития

По данным Cloudflare, на ее сети фиксируется более 50 миллиардов запросов от ИИ-ботов ежедневно. Это почти 1% всего веб-трафика компании. Многие из этих ботов работают на крупные языковые модели, которые собирают данные без разрешения, что вызывает волну судебных разбирательств со стороны правообладателей контента.

Статистика Cloudflare по ботам
График ежедневных запросов с течением времени, сравнивающий различные категории AI Crawlers.Источник: Cloudflare

AI Labyrinth — один из первых инструментов, который использует ИИ для защиты контента, а не только для его сбора. Однако остается вопрос, насколько быстро адаптируются алгоритмы скрейперов и смогут ли они научиться обходить новые ловушки. Cloudflare уже заявила, что это лишь первая версия AI Labyrinth, и в будущем планирует усложнять методы дезинформации для ботов.

Противостояние между сайтами и скрейперами продолжается. Ранее рассказывали о другом инструменте независимого хакера, который работает по такому же принципу.