GPT-o3 оказалась УМНЕЕ всех нейронок в тесте Google — модель обошла даже свою более новую версию GPT-o4 mini.

На платформе Kaggle Game Arena ИИшки заставили играть шахматные партии, чтобы проверить уровень интеллекта каждой из них. Весь турнир лидировал Grok 4, но в финале GPT-o3 уделала его о счетом 4:0.

Для контекста: в тестах участвовали GPT-o4 mini, GPT-o3, Gemini 2.5 Pro, Claude Opus 4, Grok 4 и другие модели. Как отмечают авторы турнира:

Игры помогают нам понять, как модели справляются со сложными задачами ризонинга.

Многие игры служат прокси-сервером для реальных навыков и могут проверить способности модели в таких областях, как стратегическое планирование, адаптация и память.

На фоне новостей о глупости GPT-5 выглядит особенно иронично.