Комментарии 0
...комментариев пока нет
GPT-o3 оказалась УМНЕЕ всех нейронок в тесте Google — модель обошла даже свою более новую версию GPT-o4 mini.
На платформе Kaggle Game Arena ИИшки заставили играть шахматные партии, чтобы проверить уровень интеллекта каждой из них. Весь турнир лидировал Grok 4, но в финале GPT-o3 уделала его о счетом 4:0.
Для контекста: в тестах участвовали GPT-o4 mini, GPT-o3, Gemini 2.5 Pro, Claude Opus 4, Grok 4 и другие модели. Как отмечают авторы турнира:
Игры помогают нам понять, как модели справляются со сложными задачами ризонинга.
Многие игры служат прокси-сервером для реальных навыков и могут проверить способности модели в таких областях, как стратегическое планирование, адаптация и память.
На фоне новостей о глупости GPT-5 выглядит особенно иронично.