OpenAI представила первые за шесть лет нейросети с открытым исходным кодом

OpenAI анонсировала две первые за шесть лет модели с открытым исходным кодом — gpt-oss-120b и gpt-oss-20b. Они поставляются под лицензией Apache 2.0 и полным доступом к цепочке рассуждений. Выпуск призван закрыть нишу доступных ИИ с высоким качеством и низкой стоимостью.

Growtika/Unsplash

Старшая версия gpt-oss-120b — это 117 млрд параметров, из которых на каждый 1 токен задействуется 5,1 млрд. Она требует 80 ГБ памяти и подходит для крупных проектов. Младшая, gpt-oss-20b, весит 21 млрд параметров, активных — 3,6 млрд, и запускается даже на устройствах с 16 ГБ системной памяти — удобно для локальных решений и стартапов.

В тестах старшая модель показала результаты почти на уровне o4-mini, а компактная младшая обошла o3-mini в математике и медицине. Обе умеют работать в трех режимах рассуждений: низком, среднем и высоком, — их можно балансировать между скоростью и точностью.

За безопасность отвечают метод дообучения языковых моделей adversarial fine-tuning и внешняя система имитации реальный кибератак red teaming. По качеству фильтров безопасности новые модели близки к «закрытым» аналогам. OpenAI даже запустила конкурс с фондом $500 тыс. за поиск уязвимостей.

Для бизнеса есть готовая интеграция с платформами Azure, AWS и Hugging Face. Microsoft адаптировала gpt-oss-20b под Windows через библиотеку программного обеспечения ONNX Runtime. Весы обеих моделей для разработчиков искусственного интеллекта с открытым кодом уже лежат в хранилище Hugging Face, а для тех, кто хочет сэкономить ресурсы, есть встроенный инструмент MXFP4 — он облегчает модель и делает ее более экономичной в использовании.

Последний раз OpenAI выпускали модель с открытым исходным кодом шесть лет назад — это был алгоритм GPT‑2. С тех пор компания закрыла доступ к коду и весам нейросетей, за что даже получила прозвище ClosedAI.

Поэтому выпуск сразу двух мощных открытых языковых моделей — это шаг к демократизации ИИ: теперь разработчики могут свободно использовать и адаптировать модели, включая в коммерческие продукты. Это усиливает конкуренцию компании с Meta (признана в России экстремистской и запрещена) и Mistral и сигнализирует о смене курса OpenAI в сторону большей открытости и прозрачности.