Вышла ИИ-модель Claude Opus 4.5 для программирования и работы с агентами. Она оказалась мощнее, даже чем Gemini 3 Pro

Anthropic представила новую топовую модель Claude Opus 4.5. Она стала заметно лучше в задачах реального программирования, агентных сценариях и продуктивной работе с компьютером. Модель также прибавила в глубоких исследованиях, аналитике и работе с Excel и презентациями.

На SWE-bench Verified Opus 4.5 показывает лучший результат среди всех актуальных моделей, включая Gemini 3 Pro и GPT-5.1, и уверенно решает задачи, которые ещё недавно считались почти недостижимыми.

Модель возглавила таблицы на SWE-bench Multilingual в семи из восьми языков программирования. Улучшения затронули не только код: выросла точность в задачах зрения, математики, сложного рассуждения и мультимодального анализа.

Кроме того, новая версия прошла внутренний экзамен для инженеров по производительности лучше любого человека за всё время существования теста. Модель стала заметно экономнее в рассуждениях, поскольку тратит меньше токенов на поиск решения.

Важное нововведение — параметр effort, управляющий глубиной рассуждений:

На среднем уровне модель повторяет качество Sonnet 4.5, но использует на 76% меньше токенов
На максимальном превосходит Sonnet 4.5 на 4,3 п.п., оставаясь более экономной (минус 48% токенов)

Компания также увеличила лимиты на использование Opus 4.5. Пользователи получат примерно тот же объём токенов Opus, который раньше был доступен для Sonnet. Модель теперь можно использовать как основной рабочий инструмент.

Что-то пошло не так

Мы в Telegram

Форум

Избранное