Команда Tencent Hunyuan выпустила новую модель искусственного интеллекта с открытым исходным кодом, предназначенную для создания полностью исследованной и интерактивной 3D-сред. Названная Hunyuan 3D World Model 1.0, система позволяет пользователям создавать захватывающие виртуальные миры из текстовых или изображений, с потенциальными приложениями для игр, виртуальной реальности и создания цифрового контента.
Модель была официально запущена в воскресенье и теперь доступна как для академического, так и для коммерческого использования через GitHub Tencent и обнимающегося репозиториев лица. Те, кто предпочитает не запускать его локально, также могут проверить модель непосредственно через онлайн -платформу Tencent.
В отличие от более ранних методов, которые были сосредоточены исключительно на видео на основе видео или 3D, подход Tencent смешивает как визуальное разнообразие, так и геометрическую последовательность. «В то время как первое обеспечивает сильное визуальное разнообразие, последний обеспечивает 3D -согласованность и эффективность в рендеринге. Однако ни один из этих подходов не предлагает оба», — заявила команда Hunyuan на странице проекта. Их решение представляет новую структуру, построенную на семантически слоистых 3D -сетчатых представлениях.
Эта структура позволяет панорамным изображениям выступать в качестве прокси для виртуальных сред 360 градусов, которые затем разлагаются и реконструируются в детальные, интерактивные пространства. Окончательный результат может служить игровым активам, которые пользователи могут ориентироваться в режиме реального времени.
Модель основана на генераторе изображений Flux, но также может быть адаптирована для использования с другими инструментами, такими как Hunyuan Image, Kontext и стабильная диффузия. Хотя на этом этапе компания не подтвердила доступ к API, разрешающая лицензия позволяет широко использоваться, в том числе для коммерческой разработки.
Предлагая как высококачественную рендеринг, так и интерактивность в реальном времени, модель Tencent Hunyuan 3D World входит в растущую нишу в генеративном ИИ: автоматизированное создание исследовательских цифровых сред. Эти инструменты все чаще используются для проектирования игровых уровней, создания виртуальных миров для обучения агентов ИИ и разрабатывают иммерсивный контент для Metaverse.