Microsoft запускает модель MAI Image 2 для Copilot и Bing Image Creation

Microsoft запустила модель генерации изображений с использованием искусственного интеллекта второго поколения — MAI Image 2, которая, как утверждается, генерирует более реалистичные изображения и текст, который легче читать.

Чтобы достичь уровня реализма, во время разработки компания сотрудничала с фотографами, дизайнерами и визуальными рассказчиками, чтобы улучшить качество игры.

Основная цель модели MAI Image 2 — создать изображение, состоящее из естественного освещения, точных тонов кожи и реалистичной среды, что в конечном итоге помогает свести к минимуму последующее редактирование после создания изображений, экономя время пользователей.

В сообщении в блоге Microsoft говорится: «MAI-Image-2 создан для творческих людей, которым нужны изображения, которые кажутся существующими в реальном мире, с естественным освещением, точными тонами кожи и обжитой средой. Теперь творческие люди могут тратить меньше времени на исправление постобработки и больше времени на создание».

Помимо фотореализма, Microsoft также усовершенствовала генерацию текста в изображении и утверждает, что генерирует точный текст для инфографики, слайдов, диаграмм и многого другого.

MAI-Image-2 доступен для предварительного просмотра на MAI Playground, а также его можно будет использовать в Copilot и Bing Image Creator. Microsoft стремится обеспечить бесперебойные рабочие процессы, позволяя дизайнерам, маркетологам и разработчикам создавать высококачественные визуальные эффекты непосредственно в приложениях, которые они уже используют.

Кроме того, доступ к API в настоящее время доступен избранным клиентам Microsoft. Компания также планирует расширить доступ, который, как ожидается, вскоре появится через Microsoft Foundry для разработчиков.

В своем объявлении технологический гигант также объявил, что его MAI-Image-2 занял третье место среди лабораторий искусственного интеллекта по созданию преобразования текста в изображения в мире согласно таблице лидеров Arena.ai.

Хотя результаты выглядят приятными, Microsoft конкурирует с некоторыми ведущими моделями изображений искусственного интеллекта, включая Nano Bana 2 от Google, DALL-E 3 от OpenAI, Midjourney 6.1 и другими.