DeepSeek R1 Safe Model Model, запущенная Huawei с акцентом на безопасность, уклоняясь от политики

Huawei представила новую версию системы искусственного интеллекта Deepseek, которая приоритет приоритетам в области безопасности и соответствия нормативным требованиям, подчеркивая ужесточение надзора Китая передовых инструментов ИИ.

Модель, называемая Deepseek-R1-Safe, была разработана в сотрудничестве с Университетом Чжэцзян, одним из ведущих академических учреждений Китая и альма-матер основателя Deepseek Liang Wenfeng. Huawei пояснил, что ни Liang, ни Deepseek Company не были непосредственно вовлечены в проект.

Построенная на модели Deepseek-R1 с открытым исходным кодом, система была переподготовлена ​​с использованием 1000 чипов ASED AI Huawei. По данным компании, цель состояла в том, чтобы интегрировать гарантии, которые не позволяют модели участвовать в политически чувствительных дискуссиях, создавая токсическую речь или поощряя незаконную деятельность.

Huawei утверждает, что Deepseek-R1-Safe был «почти на 100% успешным» в блокировании политически чувствительного контента во время обычных взаимодействий. Тем не менее, эффективность снизилась примерно до 40%, когда пользователи попытались обойти ограничения через ролевую боль, косвенные сценарии или закодированные подсказки. В целом, система достигла 83% оценки защиты безопасности, опередив конкурирующих на крупных языковых моделях, таких как QWEN-235B от Alibaba и DeepSeek-R1-671B до 15%. Важно отметить, что Huawei сказал, что эти меры безопасности снизили производительность модели менее чем на 1% по сравнению с оригиналом.

Выпуск подчеркивает стремление Пекина для обеспечения того, чтобы платформы искусственного интеллекта отражают «социалистические ценности» и соответствовать строгим границам онлайн -выражения. Другие домашние платформы, такие как Baidu Ernie Bot, уже блокируют ответы на политически чувствительные проблемы, и обновление Huawei, по -видимому, формализует эти элементы управления в рамках современных систем ИИ.

Развитие также отражает более широкую глобальную тенденцию адаптации ИИ к местным приоритетам. В начале 2025 года саудовская арабская компания Humain выпустила арабский чат-бот, предназначенный для воплощения исламской культуры и ценностей. Такие инициативы сигнализируют о том, как страны все чаще стремятся формировать ИИ не только для технических результатов, но и для отражения культурных и политических рамок.

Huawei представила модель на своей ежегодной конференции Connect в Шанхае, где она также представила свою долгосрочную дорожную карту для полупроводников и вычислительной инфраструктуры. Объявление происходит на фоне растущего внедрения технологий DeepSeek в Китае и продолжающихся глобальных дебатов о балансе между инновациями, безопасности и регулированием искусственного интеллекта.