Компания OpenAI анонсировала выход двух новых моделей искусственного интеллекта, которые можно бесплатно загрузить и изменить. Это решение направлено на конкуренцию с аналогичными предложениями американских и китайских разработчиков. Релиз моделей gpt-oss-120b и gpt-oss-20b происходит на фоне давления на компанию с требованием поделиться внутренними механизмами своего программного обеспечения в духе ее изначальной некоммерческой миссии.
Комментарии 0
...комментариев пока нет
OpenAI выпускает бесплатные ИИ-модели, которые можно обучить для своих задач
Выпуск открытых моделей OpenAI происходит в условиях, когда китайский стартап DeepSeek встряхнул индустрию своей низкозатратной высокопроизводительной моделью с открытыми весами. CEO OpenAI Сэм Альтман ранее в этом году признал, что его компания оказалась «на неправильной стороне истории» в вопросе открытости своих технологий. Теперь OpenAI решила исправиться.

Unsplash
Каждая модель представляет собой Transformer, использующий архитектуру архитектуру Mixture-of-Experts (MoE), которая позволяет активировать относительно небольшое число параметров на каждый токен для сокращения количества активных параметров, необходимых для обработки входных данных. GPT-oss-120b активирует 5,1 миллиарда параметров на токен (общее количество 117 миллиардов), а gpt-oss-20b — 3,6 миллиарда (общее количество 21 миллиард). Общее количество параметров составляет 117 и 21 миллиард соответственно.