Китайский ИИ-стартап DeepSeek запустил модель v3.1

В стремительно развивающемся мире искусственного интеллекта китайский стартап DeepSeek вновь по-тихому запустил свою модель v3.1, которая теперь рассматривается как серьезный конкурент последним разработкам из США. Выпущенная через две недели после проблемного дебюта GPT-5 от OpenAI, модель DeepSeek v3.1 привлекает благодаря своей производительности в ключевых тестах, отличному ценообразованию и архитектуре, оптимизированной для работы независимо от американских технологий.

DeepSeek объявил о модели v3.1 через сообщение в WeChat, широко используемой социальной платформе Китая, а также на сайте сообщества Hugging Face. Новая модель насчитывает 685 миллиардов параметров, что ставит её в ряды крупнейших ИИ-систем мира.

В отличие от многих конкурентов, DeepSeek использует архитектуру "mixture-of-experts" (смесь экспертов), активирующую только необходимые части модели для каждого запроса. Это приводит к снижению вычислительных затрат – привлекательная особенность для разработчиков, которые ищут как мощность, так и эффективность при развертывании ИИ.

Более того, v3.1 объединяет возможности быстрого реагирования с продвинутым рассуждением – технический шаг вперед, делающий её более универсальной, чем многие альтернативы с открытыми весами. Бен Диксон, технический аналитик и основатель TechTalks, сообщил Fortune, что гибридная архитектура – это самая важная особенность, отличающая её от более ранних итераций и других моделей с открытым исходным кодом.

Хотя модели DeepSeek еще не получили широкого распространения среди американских компаний, они приобрели значительную популярность в Китае и всё чаще применяются во других странах, в том числе в России.

Эксперты отрасли отмечают, что хотя последний релиз DeepSeek может не представлять такого же прорыва, как модель R1 в начале этого года, апдейт включает значимые улучшения.

DeepSeek не единственный игрок в гонке ИИ Китая. Другие крупные участники включают Alibaba с моделью Qwen, Moonshot AI с Kimi и Baidu с Ernie. А время выпуска v3.1, так близко к презентации GPT-5, которая, по мнению многих экспертов, не оправдала ожиданий, указывает на планы Китая поддерживать и потенциально превосходить американских "коллег".

Тем временем аналитики предупреждают, что растущие ожидания вокруг генеративного ИИ могут подпитывать пузырь, так как многие компании еще не видят ощутимой отдачи, продолжая прожигать сотни миллионов долларов инвестиций. Недавнее исследование MIT показало, что в 95% случаях вниедрения ИИ не приводят к увеличению прибыли, что указывает на несоответствие между шумихой и реальным влиянием. Примечательно, что исследование предполагает, что наибольшая ценность заключается не в эффектных инструментах фронтенда, а в автоматизации бэкенда, что оптимизирует операции и снижает затраты.