Детали успеха: как DeepSeek удалось обойти мощные ИИ-модели
2025 год начался с настоящего цунами в сегменте искусственного интеллекта.

После долгих обсуждений различных моделей, компании, такие как Google, Microsoft, Apple, Meta и, конечно, OpenAI, были потрясены появлением китайской компании DeepSeek, которая представила свою ИИ-модель и произвела фурор в отрасли.
Вопрос о том, как Китай смог выпустить DeepSeek с ограничениями, связанными с торговой войной с США и невозможностью приобретения мощных видеокарт от NVIDIA, стал актуальным. Тем не менее, DeepSeek заявила, что использует творческий подход, полагаясь на инфраструктуру на базе чипов H800 от NVIDIA и обучая свою модель более 2,7 миллиарда часов при стоимости всего 5,6 миллиона долларов. Это выглядит незначительно по сравнению с тем, что OpenAI потратила около 100 миллионов долларов на обучение GPT-4.
Также стоит отметить стоимость содержания DeepSeek. Если ChatGPT обходится примерно в 700 тысяч долларов в день, то DeepSeek функционирует всего за 87 тысяч долларов в день. Это делает DeepSeek в 10 раз дешевле в эксплуатации по сравнению с ChatGPT, что является важным моментом, который необходимо учитывать.
В марте DeepSeek раскрыла некоторые данные о затратах и доходах, связанных с их моделями V3 и R1, показывая, что они могут предложить конкурентоспособные решения на рынке ИИ, пишет terra.
Уточнения
Ры́нок — совокупность процессов и процедур, обеспечивающих обмен отдельными товарами и услугами между покупателями (потребителями) и продавцами (поставщиками).