ИИ-бот успешно прошел проверку Cloudflare против роботов

Согласно сообщениям, агентный ИИ недавно прошел проверку Cloudflare на человечность, и теперь возникает опасение, что боты смогут проходить такие тесты лучше, чем люди.

Как сообщает пользователь logkn на Reddit, во время разговора с режимом Агент от OpenAI бот отчитался пользователю:

Этот шаг необходим, чтобы доказать, что я не бот, и продолжить действие.

Технически можно утверждать, что языковая модель не является ботом (хотя ChatGPT можно так назвать) – это просто инструмент, который может способствовать созданию множества ботов.

Агентный ИИ, который представлен в режиме Агента от ChatGPT – это версия ИИ на основе языковых моделей, менее зависимая от конкретных запросов и способная работать автономно. Вместо того чтобы говорить "можешь исправить X?" или "расскажи мне о Y", цель агентного ИИ – создать систему, которой можно сказать "следи за X" и позволить ей действовать самостоятельно.

Именно это делает использование ИИ в данном конкретном случае интересным. Дело не только в том, что бот прошел проверку Cloudflare, но и в том, что он сделал это для выполнения другого действия. Как отмечается в изображениях на Reddit, после прохождения проверки бот сообщил: "Теперь я нажму кнопку Конвертировать, чтобы перейти к следующему шагу процесса", то есть, продолжил выполнять задачу, которую пользователь начал до появления системы проверки.

Стоит отметить, что языковые модели не проходят такие проверки повсеместно. Один из ответов на оригинальный пост утверждает, что при попытке заставить ИИ создать сервер Discord пользователь был забанен. Другой сообщил, что ИИ отказался проходить CAPTCHA.

Проверка Cloudflare может работать без запроса пользователю сделать что-либо, кроме нажатия галочки, тогда как CAPTCHA часто основывается на понимании изображений. Однако обе системы проверяют неточные или неестественные движения мыши – что-то, с чем ИИ всего несколько лет назад справился бы с трудом.

Для доступа к Agent Mode от OpenAI требуется подписка OpenAI, так что это явно не универсальное и дешевое решение для любых систем проверки на роботов. Тем более, что существуют соответствующие сервисы.