DeepSeek торопится выпустить новую модель R2

Логотип компании
27.02.2025
DeepSeek торопится выпустить новую модель R2
Изображение: RKY Photo / Shutterstock.com
Китайская компания DeepSeek готовится к релизу новой модели искусственного интеллекта R2, стремясь закрепить свои позиции в сфере разработки ИИ. Недавний успех бюджетной модели R1, которая опередила многих западных конкурентов, вызвал заметное беспокойство в отрасли, и DeepSeek намерена добиваться еще большего.  

По некоторым данным, выпуск R2, изначально запланированный на май, может состояться значительно раньше. Компания не раскрывает деталей, но известно, что модель получит улучшенные возможности программирования и расширенную поддержку многоязычного анализа. DeepSeek воздерживается от комментариев по поводу ускоренных сроков разработки.

Новая реальность для ИИ-отрасли

Прорыв DeepSeek кардинально меняет баланс сил в индустрии. Несмотря на использование менее мощных чипов Nvidia, модель R1 смогла составить конкуренцию решениям крупнейших разработчиков. Компания доказала, что можно создавать мощные ИИ-модели при меньших затратах. Это заставило другие компании ускорить свои разработки и сломало монополию ведущих игроков.

Что ожидать от новой нейросети DeepSeek?

Вашингтон напряженно следит за создавшейся ситуацией. Известно, что в США технологическое лидерство в ИИ считается стратегическим приоритетом. Вполне возможно, что по результатам «наблюдений», американцы введут новые ограничения на поставки вычислительных компонентов в Китай. Тем временем китайские корпорации уже начали интеграцию моделей DeepSeek в свои продукты, усиливая влияние компании.

Стратегия с нестандартным подходом

Несмотря на стремительный успех, основатель DeepSeek Лян Вэньфэн остается загадочной фигурой. Разбогатев, он практически исчез из публичного пространства в 2024 году. Кроме того, рабочие процессы в компании отличаются от принятых в китайских корпорациях: вместо жестких иерархий и изнурительных рабочих часов сотрудники работают в гибкой среде, получая высокие зарплаты и свободу в исследованиях.

Лян делает ставку не на массовую коммерциализацию, а на фундаментальные исследования. Его инвестиционный фонд High-Flyer финансирует передовые разработки и предоставляет DeepSeek доступ к мощным вычислительным ресурсам.

Секрет успеха в вычислительных мощностях

Ключевым фактором успеха DeepSeek стал доступ к вычислительным мощностям. High-Flyer начал собирать кластеры суперкомпьютеров задолго до создания DeepSeek, что стало решающим преимуществом, когда США ввели санкции против Китая. Компания активно использует передовые архитектуры, такие как Mixture-of-Experts (MoE) и Multihead Latent Attention (MLA), что значительно снижает затраты на вычисления. Аналитики оценивают, что модели DeepSeek обходятся в 20–40 раз дешевле, чем аналоги от OpenAI.

Реакция на новинку в Китае и мире

По мере роста DeepSeek реакция мировых регуляторов становится все более неоднозначной. Австралия, Италия и Тайвань запретили использование приложения DeepSeek на всех правительственных устройствах/ По официальной версии это произошло из-за проблем с конфиденциальностью. Эксперты IT-World предполагают, что если модели DeepSeek будут использоваться в китайских государственных структурах, то это может привести и к новым санкциям со стороны США.

Пекин, в свою очередь, все больше поддерживает DeepSeek. Китайские корпорации Baidu, Tencent и Lenovo, уже начали интеграцию моделей DeepSeek в свои сервисы.

Между тем, xAI, основанная Илоном Маском, представила свою новую модель искусственного интеллекта — Grok 3. По предварительным данным, эта нейросеть намного мощнее, чем известные модели, такие как Gemini 2 Pro от Google DeepMind, DeepSeek V3, Claude 3.5 от Anthropic и даже GPT-4o от OpenAI.