«DeepSeek – это победа над сегрегацией человечества»: как китайцы хакнули ИИ-рынок

DeepSeek выпустила бесплатную большую языковую модель, на создание которой по ее словам, ушло не больше $6 миллионов DeepSeek выпустила бесплатную большую языковую модель, на создание которой по ее словам, ушло не больше $6 миллионов Фото: © Cfoto/Keystone Press Agency / www.globallookpress.com

Как китайцы хакнули систему

Что бы ты не делал хорошо, всегда найдется азиат, который сделает это лучше. Этой шуткой можно кратко описать причину нынешней шумихи на американском ИИ-рынке. На прошлой неделе китайская компания DeepSeek выпустила свою передовую размышляющую ИИ-модель R1. По многим параметрам она обошла модель о1 от американской компании OpenAI — разработчика известной во всем мире ChatGPT. Примечательно, что китайская ИИ-модель имеет открытый исходный код, абсолютно бесплатна и работает в России без каких-либо ограничений.

Но главное — китайцам удалось сделать все это за гораздо меньшие деньги, чем OpenAI. И это на фоне новостей о том, что в США три компании OpenAI, SoftBank и Oracle запустят совместное предприятие Stargate, которое инвестирует в развитие искусственного интеллекта рекордные $500 миллиардов. Об этом объявил новый президент США Дональд Трамп. Stargate называют новым «Манхэттенским проект». К слову, реальный Манхэттенский проект стоил дешевле — примерно $30 млрд в пересчете на нынешние деньги.

R1 — новейшая рассуждающая модель от китайской ИИ-лаборатории DeepSeek. Имеет открытый исходный код, то есть любой разработчик может взять базовую кодовую базу, адаптировать ее и даже доработать под свои нужды. Количество параметров в модели DeepSeek R-1 может варьироваться от 5 миллиардов до 671 миллиарда.

Это рассуждающая модель, то есть чат-бот перед основным ответом показывает цепочку своих рассуждений. Модель показывает высокие результаты в тестах на математическое рассуждение — способна решать сложные задачи, требующие не только вычислений, но и понимания контекста. Также она умеет писать код, хорошо справляется с вопросами, связанными с физикой, химией и другими науками. Доступна для локального запуска, — ее можно использовать без подключения к интернету.

И тут DeepSeek выпускает бесплатную большую языковую модель, на создание которой по ее словам, ушло не больше $6 миллионов. При этом, американцы ограничивают Китай в поставках передовых ИИ-чипов. Для своей модели Deep Seek использовал чипы NVIDIA H800 c урезанными возможностями. При этом зарубежные СМИ ранее писали, что OpenAI потратила около $7 млрд на обучение языковых моделей и еще $1,5 млрд на персонал, а ее операционные убытки могут достигать $5 миллиардов.

Американский производитель графических ускорителей NVIDIA подешевели почти на 14%, Microsoft снижаются на 4,4% Американский производитель графических ускорителей NVIDIA подешевели почти на 14%, Microsoft снижаются на 4,4% Фото: © Michael Nagle/XinHua / www.globallookpress.com

Как американский рынок отреагировал на прорыв китайцев

Рынок отреагировал на прорыв китайцев бурно. Успех китайского стартапа в сфере ИИ вызвал у инвесторов сомнения в суммах, потраченных американскими технологическими гигантами на производителей чипов, пишут западные СМИ и эксперты. Американский производитель графических ускорителей NVIDIA, которого называют монополистом на рынке GPU потеряла почти $500 млрд капитализации. Акции компании подешевели почти на 14%.

Падают и акции других технологических компаний: ценные бумаги Microsoft потеряли 4,4% на премаркете, тайваньской TSMC — 8,3%, производителя чипов ARM — 8,2%, Qualcomm — 2,4%, японского производителя чипов Advantest — упали на 8,6% к закрытию торгов 27 января, у Tokyo Electron — на 4,9%.

«Новая модель DeepSeek очень впечатляет с точки зрения того, насколько эффективно они создали модель с открытым исходным кодом, которая выполняет вычисления во время логического вывода и является высокоэффективной», — отметил генеральный директор Microsoft Сатья Наделла на Всемирном экономическом форуме в Давосе. — «Мы должны очень серьезно относиться к разработкам в Китае».

В Сан-Франциско руководители и сотрудники OpenAI в срочном порядке изучают технологию DeepSeek, пишет Bloomberg. «По словам людей, знакомых с ситуацией, которые говорили на условиях анонимности, чтобы обсудить личные вопросы, некоторые сотрудники OpenAI пытаются понять, как именно DeepSeek смогла выпустить такую модель. Другой человек сказал, что в компании есть ощущение, что OpenAI нужно очень серьезно относиться к разработкам китайских компаний, поскольку это дает возможность внедрять инновации и улучшать существующие модели. Генеральный директор OpenAI Сэм Альтман недавно сказал сотрудникам, что этот релиз знаменует собой серьезный сдвиг в развитии стартапа, сообщил один из источников», — отмечает издание.

Тем временем мобильно приложение DeepSeek вышло в топ AppStore в США. Глава DeepSeek Лян Вэньфэн даже был замечен на встрече с премьер-министром Китая Ли Цяном. Накануне компания сообщила о кибератаке на свои ресурсы. В результате регистрацию новых пользователей в приложении ограничили. Сегодня стало известно, что китайская компания представила семейство мультимодальных моделей искусственного интеллекта Janus Pro. Разработчики уверяют, что алгоритмы способны анализировать и генерировать изображения лучше, чем модель DALL-E 3 от OpenAI.

В Сан-Франциско руководители и сотрудники OpenAI в срочном порядке изучают технологию DeepSeek (на фото генеральный директор OpenAI Сэм Альтман) В Сан-Франциско руководители и сотрудники OpenAI в срочном порядке изучают технологию DeepSeek (на фото генеральный директор OpenAI Сэм Альтман) Фото: © Marco Destefanis/Keystone Press Agency /news.ru / www.globallookpress.com

«Когда на рынок выходит конкурент, который не просит денег за свое решение, это очень сильно ударяет по рынку»

«Во-первых, DeepSeek работает на графических процессорах общего назначения, а не на специализированных. Во-вторых, она требует значительно меньше вычислительных мощностей для обучения. В-третьих, она „опенсорсная“. Это три составляющих успеха. Ее можно запускать на большом количестве обычных компьютеров, а не строить дата-центры. Также этих компьютеров нужно гораздо меньше», — объясняет суть прорыва китайской компании директор института искусственного интеллекта, робототехники и системной инженерии КФУ Дмитрий Чикрин.

По его словам не совсем корректно сравнивать R1 c моделями от OpenAI, так как они предназначены для разных целей. «Но, скажем так, она находится на уровне текущих топовых моделей и от OpenAI и от Anthropic», — отмечает эксперт.

«DeepSeek уже ударил по Nvidia и другим производителям чипов. Это было абсолютно предсказуемо. Когда на рынок выходит „опенсорсный“ конкурент, который не просит денег за свое решение, причем молодой стартап, то это очень сильно ударяет по рынку. Поэтому, в частности, OpenAI уже стала радикально снижать стоимость на услуги своей новейшей модели о3, — добавляет Чикрин. — Конечно, это усиливает позиции КНР. Ребята просто молодцы, они достаточно давно этим занимаются, с 2016 года. Всему миру повезло, наверное».

«Они смогли в тысячу раз дешевле сделать все то, что казалось очень дорогим, — то есть обучение нейросети. Как они это сделали — это отдельный вопрос. Ну, а по своей результативности она сравнима со всеми другими моделями, — объясняет вице-президент Академии наук РТ в области развития искусственного интеллекта и информационных технологий Айрат Хасьянов.

И если другие американские компании, которые получили миллиарды от инвестиций, с какого-то момента перестали публиковать сначала обучающий набор, а потом исходный код, то китайская компаниия вышла с открытым исходным кодом, напоминает Хасьнов. «Вроде OpenAI означает открытый искусственный интеллект, а по факту они стали противоположны собственному названию, — говорит он. — Это такая победа прогресса над сегрегацией человечества. Создатели DeepSeek потратили 5 миллионов долларов против миллиардов, которые потратила OpenAI. Это огромный разрыв».

Эксперт обращает внимание на еще один парадокс: человеческий мозг имеет мощность 20 ватт, а дата-центр, который строят сейчас в США, — полтора гигаватта. «При этом предполагается, что дата-центр по ряду возможностей будет превосходить то, что может человек. Тем не менее, человеческий мозг, употребляя эти несчастные 20 ватт, вполне справляется с задачами обучения и даже более чем. У нас еще есть физический интеллект, который обеспечивает ориентацию в пространстве, управление мышцами. Так что нам есть к чему стремиться в плане эффективности. Я думаю, что DeepSeek — это еще не последний результат, будут еще прорывы в области специализированных нейронных сетей, которые станут потреблять намного меньше, решая какие-то задачи быстрее».

Правда Хасьянов считает, что нанести ущерб этим бизнесу NVIDIA не получится, а вот ударить по бизнесу OpenAI — вполне. «Это хорошо, потому что, когда генеральный директор компании Сэм Альтман начал говорить о том, что сейчас в США происходит революция в области ИИ, сравнимая с Манхэттенским проектом, честно говоря, меня это немножечко напрягает. Когда кто-то пытается получить абсолютно доминирование на планете, это не очень хорошо», — говорит он.

«Инвесторы вкладывали в компанию Nvidia, потому что всем до недавнего времени было очевидно, что нужно вкладываться в инфраструктуру: это и есть путь развития искусственного интеллекта. А китайцы показали, что это не так. Это все переворачивает, — отмечает и Булат Замалиев — уполномоченный по ИИ в РТ. — Есть обоснованное мнение, что DeepSeek — это такой хитрый ход от компании Meta*. Марк Цукерберг строит так стратегию по конкуренции с OpenAI, с закрытыми моделями».

По его словам, произошедшее — очень хороший знак для индустрии, потому что это фактически открывается возможность для создания различных foundation models — базовых моделей, которые открывают доступ для многих компаний по разработке и обучению собственных моделей. «Раньше это был удел мегакорпораций, у которых сотни тысяч видеокарт самых современных. Требовалась инфраструктура на миллиарды долларов. Сейчас же фактически тренд по тому, чтобы снижать порог входа. Это очень интересно и особенно важно, например, для госуправления», — заключает он.