Как только Nvidia преодолела отметку рыночной капитализации в 5 триллионов долларов, китайская DeepSeek выпустила новый набор крупных языковых моделей, которые могут еще раз проверить доминирование чипового гиганта, на этот раз с более глубоким отходом от его аппаратной экосистемы.
Семейство DeepSeek V4, выпущенное в тот же день, когда Nvidia закрылась с рыночной капитализацией в 5 триллионов долларов, является самым амбициозным релизом компании с тех пор, как ее модель R1 потрясла мировые рынки в начале 2025 года, уничтожив после этого оценку Nvidia почти на 600 миллиардов долларов.
В недавнем подкасте генеральный директор Nvidia Дженсен Хуанг заявил, что если китайский стартап в области искусственного интеллекта DeepSeek оптимизирует свои новые модели на чипах Huawei Technologies, это будет «ужасным результатом» для США.
Если «будущие модели ИИ будут оптимизированы совершенно иначе, чем американский технологический стек», и по мере того, как «ИИ распространится в остальной мир» с китайскими стандартами и технологиями, Китай «станет превосходить» США, сказал Хуан в подкасте Dwarkesh.
Стоит прочитать: Китай сокращает разрыв в области искусственного интеллекта с США почти до нуля, показывает отчет Стэнфорда
Дешевле, быстрее и не на базе Nvidia
В центре релиза — V4-Pro, модель с 1,6 триллионами параметров, предназначенная для кодирования и сложных агентских задач, а также меньший вариант V4-Flash, созданный для скорости и экономической эффективности.
Но более серьезные изменения кроются под капотом.
Впервые DeepSeek оптимизировала свою флагманскую модель для отечественных чипов Huawei Technologies, а не для графических процессоров Nvidia, что знаменует собой значительный шаг в усилиях Китая по снижению зависимости от американских технологий.
Более ранние модели DeepSeek, включая V3 и R1, были обучены на оборудовании Nvidia. V4, напротив, позиционируется как тестовый пример того, сможет ли китайская экосистема искусственного интеллекта работать на собственном стеке микросхем.
Непревзойденная производительность за небольшую часть стоимости
DeepSeek снова делает ставку на снижение затрат. V4-Pro активирует только 49 миллиардов параметров на каждый токен, несмотря на их общее количество в 1,6 триллиона, что позволяет ему обеспечить производительность почти на переднем уровне при значительно меньших затратах на вычисления. Компания утверждает, что это обеспечивает производительность, сравнимую с ведущими моделями, но за небольшую цену.
Цены на API подчеркивают эту идею. V4-Pro стоит 1,74 доллара за миллион входных токенов и 3,48 доллара за миллион выходных токенов, что примерно в 50 раз дешевле, чем такие модели, как Claude Opus. Модель V4-Flash еще более агрессивна: ее цена составляет всего 0,14 доллара США за миллион входных токенов.
Это соответствует шаблону, заданному более ранней моделью R1 DeepSeek, которая, по утверждению компании, была обучена всего за 6 миллионов долларов за два месяца, что намного ниже отраслевых норм. Для сравнения, Meta Platforms, как сообщается, потратила на Llama 60 миллионов долларов, а OpenAI вложила в свои модели миллиарды.
Стоит прочитать: DeepSeek возвращается после годичного молчания, исследователь предупреждает об угрозе ИИ для человеческих рабочих мест
Сравнение с лучшими
По словам DeepSeek, V4-Pro конкурирует с лучшими моделями с закрытым исходным кодом, такими как GPT-5.4 и Gemini 3.1, и при этом превосходит несколько альтернатив с открытым исходным кодом в тестах кодирования, математики и STEM.
Он также представляет контекстное окно на 1 миллион токенов по сравнению со 128 000 токенов в его предыдущем флагмане, что позволяет ему обрабатывать значительно большие наборы данных за один проход.
Сообщается, что в долгосрочных сценариях V4-Pro использует всего 27% вычислительной мощности, необходимой его предшественнику, а V4-Flash сокращает эту цифру еще до 10%.
Партнерство с Huawei усиливает геополитическое преимущество
Вскоре после запуска компания Huawei объявила о полной поддержке моделей DeepSeek V4 в своих чипах Ascend, что усилило согласованность между китайским программным обеспечением для искусственного интеллекта и отечественным аппаратным стеком.
Этот шаг происходит на фоне сообщений о политическом давлении в Китае с целью увеличения использования местных чипов, включая квоты на закупки и требования сочетать иностранное оборудование с отечественными альтернативами.
Nvidia обеспокоена не отдельной моделью, а скорее общей тенденцией.
Его доминирование основано не только на графических процессорах, но и на тесно интегрированной экосистеме программного обеспечения. Переход на чипы Ascend от Huawei требует переписывания кода, перестройки инструментов и проверки производительности в масштабе — барьеры, которые до сих пор защищали лидерство Nvidia.
Но если такие игроки, как DeepSeek, смогут продемонстрировать сопоставимую производительность при значительно меньших затратах на альтернативном оборудовании, этот ров может начать сужаться.
Запуск DeepSeek R1 в прошлом году показал, как быстро могут измениться настроения. Эффективность и производительность модели вызвали волну релизов с открытым исходным кодом по всему Китаю и поставили под сомнение предположения о стоимости создания передового ИИ.
V4 развивает этот импульс, но с более стратегическим уклоном. Сочетая недорогие модели с отечественными чипами, DeepSeek конкурирует не только в производительности; это согласуется с более широкими усилиями по локализации стека ИИ.