ИИ-модель Google DeepMind показала уровень золотых медалистов на Международной математической олимпиаде 2025

«В этом году все работает на естественном языке, от начала до конца», — заявил Тханг Луонг, специалист по информатике из DeepMind. Команда использовала большую языковую модель Deep Think, основанную на системе Gemini, но с дополнительными разработками, которые сделали ее лучше и быстрее в создании математических аргументов. «Долгое время я не думал, что мы сможем зайти так далеко с большими языковыми моделями», — добавил Луонг.

Deep Think набрала 35 из 42 баллов по 6 задачам этой олимпиады. По соглашению с организаторами, решения компьютера оценивались теми же судьями, что и работы участников-людей. Отдельно OpenAI из Сан-Франциско также достигла золотого уровня своей языковой моделью, но оценивалась независимо.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Два мира ИИ

Математика в представлении ИИ
Математика в представлении ИИ
Google DeepMind

Долгие годы исследователи ИИ разделялись на два лагеря. До 2012 года ведущим подходом было ручное кодирование правил логического мышления. С тех пор нейронные сети, которые обучаются автоматически на огромных массивах данных, совершили серию сенсационных прорывов.

Гэри Маркус, нейроученый из Нью-Йоркского университета и сторонник нейросимволического ИИ, назвал результаты DeepMind и OpenAI «ужасно впечатляющими». Он отметил, что способность решать математические задачи на уровне 67 лучших школьников мира означает действительно хорошие математические навыки.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Пока неясно, останется ли превосходство больших языковых моделей в задачах олимпиады или нейросимволический ИИ вернет себе лидерство. Системы вроде AlphaProof имеют преимущество в том, что могут сертифицировать правильность своих доказательств, тогда как доказательства языковых моделей должны проверяться людьми.

Математик Кевин Баззард из Имперского колледжа Лондона отметил, что успех на математической олимпиаде не обязательно означает готовность к серьезным исследованиям. Остается открытым вопрос, смогут ли талантливые ИИ решать реальные исследовательские задачи. DeepMind планирует предоставить исследователям доступ к версии Deep Think. «Очень скоро ИИ сможет сотрудничать с математиками», — заключил Луонг.