Индийские стартапы бросают вызов глобальным лидерам ИИ с инновационными языковыми моделями

В 2023 году, во время визита в Индию, генеральный директор Openai Сэм Альтман утверждал, что «совершенно безнадежно конкурировать с нами на моделях обучения фонда», предполагая, что разработка крупномасштабных моделей искусственного интеллекта требует ресурсов вне досягаемости от большинства стартапов.

Тем не менее, недавнее появление Deepseek, китайского стартапа ИИ, бросило вызов этому понятию. Модель AI DeepSeek с открытым исходным кодом R1, разработанная за долю от стоимости его западных коллег, продемонстрировала возможности, сравнимые с ведущими моделями, такими как CHATGPT Openai. Это развитие вызвало переоценку конкурентной ландшафта в обучении модели искусственного интеллекта.

В Индии несколько компаний делают значительные успехи в развитии ИИ, сосредотачиваясь на создании крупных языковых моделей (LLMS), адаптированных к разнообразному языковому ландшафту страны:

1. Сарвам ай
• SARVAM 2B: языковая модель с открытым исходным кодом, обученная 4-трем токенам, поддерживая 10 индийских языков, включая хинди, тамильский и телугу. Он фокусируется на таких задачах, как перевод и суммирование.

2. Технологический Махиндра
• Project Indus: модель искусственного интеллекта с открытым исходным кодом, предназначенная для улучшения корпоративных решений, таких как поддержка клиентов и автоматизация, с акцентом на индийские языки.

3. Gyan Ai
• Paramanu: серия легких моделей искусственного интеллекта, оптимизированных для индийских языков, таких как ассамский, бангла, хинди и тамильский. Эти модели эффективны, требуя меньше вычислительных ресурсов при обеспечении высокой производительности.

4. Желтый.ai
• Yellowg: проприетарная модель искусственного интеллекта, направленная на автоматизацию обслуживания клиентов через чат-ботов и голосовых помощников, предоставляя человеческий разговорной опыт в различных отраслях.

5. Uniphore
• Разговорной ИИ: специализируется на распознавании и автоматизации речи, управляемых искусственным интеллектом, для повышения эффективности колл-центра, сокращения времени ожидания клиентов и повышения качества реагирования, поддержки нескольких индийских и глобальных языков.

6. Ола
• Крутрим: доморощенная большая языковая модель, обученная обширным наборам данных индийских языков и контекстуальных данных, что позволяет точному генерации текста и разговорного ИИ. Он интегрирован в услуги OLA, включая мобильность и поддержку клиентов.

7. Hanooman Ai
• Hanooman: мультимодальная модель искусственного интеллекта, способная обрабатывать задачи текста, речи и на основе зрения на нескольких индийских языках, предназначенная для таких приложений, как чат-боты и видео-анализ.

8. corover.ai
• Bharatgpt: многоязычный виртуальный помощник, предназначенный для таких секторов, как государственные услуги, банковская деятельность и электронная коммерция, поддерживающий региональные индийские языки, чтобы облегчить общение для неанглийских носителей.

9. ai4bharat
• Indictrans2: фокусируется на разработке высококачественных моделей машинного перевода для всех 22 запланированных индийских языков, создания больших наборов данных и многоязычных моделей для продвижения доступности.

10. Абхинан и Балачандран
• Тамил-лама: языковая модель, специально предназначенная для тамильского языка, улучшая словарный запас и тонко настроенный для задач, относящихся к обработке тамильского языка.

11. Киссанай
• Denu 1.0: решение AI, разработанное для сельскохозяйственного сектора, помогая фермерам в определении заболеваний в таких культурах, как рис, кукуруза и пшеница, посредством разговора.

12. Telugu LLM Labs
• Навараса 2.0: современная языковая модель, поддерживающая 16 языков, включая хинди, телугу, тамильский, каннада и малаялам, подходящие для таких приложений, как генерация контента и образовательные ресурсы.

Эти события показывают, что более ранняя оценка Альтмана, возможно, недооценила потенциал для инноваций в таких регионах, как Индия. Успех таких компаний, как Deepseek, подчеркивает, что значительные достижения в ИИ достижимы без обширных ресурсов, традиционно считающихся необходимыми.