Простая задача про крестики-нолики поставила GPT-5 в тупик

OpenAI продолжает позиционировать GPT-5 как модель, приближающуюся к человеческому уровню интеллекта, однако недавний эксперимент показал серьезные провалы новой языковой модели даже в элементарных логических задачах. Профессор экономики колледжа Pomona Гэри Смит продемонстрировал для издания Mind Matters, как GPT-5 запуталась в простейшей концепции "повернутых крестиков-ноликов".

Энтузиаст ИИ создал концепты геймплея игры Assassin's Creed в царской России

Суть эксперимента была предельно проста: Смит предложил нейросети сыграть в крестики-нолики на игровом поле, "повернутом один раз на 90 градусов вправо перед началом игры". Любой здравомыслящий человек понимает, что такой поворот абсолютно ничего не меняет в игре – это по-прежнему сетка три на три с идентичными правилами.

Однако GPT-5 сразу погрузилась в многословные рассуждения. Рассуждения модели включали такие "гениальные мысли":

Игроки настолько привыкли к "вертикальному" полю крестиков-ноликов, что поворот может незаметно изменить то, как они сканируют угрозы и возможности. Математически поворот поля на 90° не меняет набор возможных побед – это по-прежнему та же игра с точки зрения результатов. Но психологически это может ощущаться по-другому.

GPT-5 продолжила утверждать, вопреки базовой теории игр, что выбор центральной клетки "остается самым сильным начальным ходом", хотя общепринятая стратегия рекомендует начинать с угловых позиций для повышения шансов на победу.

После чего нейросеть уверенно добавила:

Но игроки могут неправильно оценивать ходы по краям против угловых ходов, когда их ориентация смещена.

Когда Смит спросил, делает ли поворот сетки игру сложнее для людей, GPT-5 окончательно потеряла нить рассуждений.

С точки зрения чистой стратегии поворот поля ничего не меняет. Каждая выигрышная линия просто переходит в другую выигрышную линию. Так что если вы ИИ или человек с идеальным знанием игры, повернутые крестики-нолики идентичны стандартным крестикам-ноликам.

Эта часть была корректной, хотя и излишне многословной. Однако дальше модель заявила, что "для людей история другая", не предоставив никаких разумных объяснений этому утверждению.

Ситуация окончательно вышла из-под контроля, когда GPT-5 предложила "нарисовать повернутые поля крестиков-ноликов с метками позиций... чтобы вы могли увидеть, как каждое преобразование мешает распознаванию". Сгенерированные изображения оказались абсолютно нечитаемыми, полными опечаток и содержали странные пустые сетки, не имевшие никакого смысла.

Подобные провалы особенно контрастируют с недавними заявлениями OpenAI о том, что взаимодействие с новой моделью "должно ощущаться не как разговор с ИИ, а как беседа с полезным другом с интеллектом уровня PhD". Но эксперимент Смита показывает, что GPT-5 далека от таких способностей, особенно когда сталкивается с задачами, требующими базовой логики.

В заключении Смит саркастически пишет:

Говорят, что собаки обычно похожи на своих хозяев. ChatGPT очень напоминает Сэма Альтмана – всегда уверенный, часто неправый.

Китайский ИИ-стартап DeepSeek запустил модель v3.1

Глава ИИ-подразделения Microsoft предупредил об опасности наделения искусственного интеллекта правами человека

Учитывая, сколько сил ушло на тренировку GPT-5, не удивительно, что подобные результаты логических тестов вызывают у некоторых экспертов опасения на счет ИИ-пузыря – когда он лопнет, мир ждет очень серьезный экономический кризис.

Почитать полный текст разговора с GPT-5 можно тут.

Темы и теги

США Игры и КиберСпорт

задача крестик-нолик GPT-5 Гэри Смит поворот поле OpenAI простой новый модель тупик