Комментарии 0
...комментариев пока нет
xAI выпустила модель Grok 4, которая превзошла в независимых тестах o3, Gemini 2.5 Pro и Claude Opus
xAI выпустила модель Grok 4, которая превзошла в независимых тестах o3, Gemini 2.5 Pro и Claude Opus Она доступна только по подписке. Компания также запустила новый тариф стоимостью $300 в месяц.
- Разработчики представили две версии «рассуждающей» модели — Grok 4 и мультиагентную Grok Heavy для чат-бота от xAI.
- Вторую Илон Маск назвал «самой умной в мире». Она впервые решила 100% математических задач в тесте AIME 2025. Также Grok Heavy почти в два раза обошла другие модели в «Последнем экзамене человечества» (Humanity's Last Exam) от OpenAI.
Grok Heavy выполнила 44% заданий в наборе тестов из разных сфер «Последний экзамен человечества», обойдя Gemini 2.5 Pro от Google с результатом 27%.
- В тестах независимых исследователей из Artificial Analysis на программирование, математику и решение научных задач Grok 4 обошла o3 от OpenAI, Gemini 2.5 Pro от Google и Claude 4 Opus от Anthropic.
- Илон Маск заявил, что Grok 4 работает «лучше, чем Cursor» и может проанализировать и отредактировать весь файл с кодом разработчика.
Количество баллов в наборе тестов меньше, чем число решённых задач.
- Также Grok 4 протестировали в «симуляции» по ведению бизнеса Vending Bench. Она продала свыше 4500 товаров и «заработала» в два раза больше Claude 4 Opus — $4690.
- Базовая модель Grok 4 доступна по подписке SuperGrok за $30 в месяц, а продвинутая — в новом тарифе SuperGrok Heavy за $300 в месяц.
- Компания открыла доступ к Grok 4 через API. С контекстом до 128 тысяч токенов 1 млн входящих токенов обойдётся в $3, а 1 млн исходящих — в $15. Если он больше — цена удваивается. Максимальная длина контекста — 256 тысяч токенов.
- Также xAI обновила голосовой режим и добавила два новых «более эмоциональных» голоса. На презентации показали, как голосовой помощник шепчет и поёт.
- Компания сообщила, что в августе 2025 года выпустит новую модель, оптимизированную для программирования, в сентябре — мультимодального ИИ-агента, а в октябре — модель генерации видео.
Источник: vc.ru