Google DeepMind раскрывает AI Robotics Gemini Robotics, чтобы сделать роботов умнее, более способными в реальном мире

Google DeepMind объявил о двух новых моделях ИИ, робототехнике Gemini и Gemini Robotics-Er, которые значительно улучшают роботизированный интеллект и ловкость, что позволяет машинам выполнять более широкий спектр реальных задач с большей точностью и адаптируемостью.

Эти инновации, основанные на основе Gemini 2.0, новейшей мультимодальной технической модели ИИ Google. «Мы резко повышаем производительность в трех ключевых областях — общности, интерактивности и ловкости, с одной моделью», — сказала Каролина Парада, старший директор и руководитель отдела робототехники в Google DeepMind.
«Это позволяет нам строить роботов, которые более способны, более отзывчивы и более устойчивы к изменениям в их окружающей среде».

Gemini Robotics-это модель, на которой зрение, которая позволяет роботам обрабатывать и действовать в новых ситуациях, даже те, для которых они не были явно обучены. В отличие от предыдущих роботизированных систем AI, робототехники Gemini:

• Понимает новые среды динамически без предварительного обучения.
• Взаимодействовать с людьми и окружением более естественным и отзывчивым.
• Выполняет точные физические задачи, такие как складная бумага или удаление крышки бутылки, улучшение ловкости робота.

Google Deepmind рассматривает робототехнику Gemini как прыжок в формирование роботов общего назначения, способных автономно адаптироваться к реальным сценариям.

Наряду с робототехникой Gemini, Google DeepMind также представила Gemini Robotics-Er (воплощенные рассуждения), передовую модель визуального языка, предназначенная для того, чтобы помочь роботам понять и взаимодействовать со сложными, реальными средами. «Например, если вы упаковываете коробку для завтрака, вам нужно знать, где все, как открыть ланч -бокс, как схватить предметы и где их разместить. Это тот вид рассуждений Близнецов, робототехника-эр,-объяснил Парада.

Gemini Robotics-Er предназначена для роботистов для интеграции с существующими низкоуровневыми контроллерами, что облегчает разработку новых возможностей, основанных на AI, управляемых AI.

Поскольку роботы получают большую автономию, безопасность остается главным приоритетом. Исследователь Google DeepMind Викас Синдхвани подчеркнул, что компания разрабатывает многоуровневый подход безопасности для обеспечения ответственного развертывания ИИ. «Модели Gemini Robotics-Er обучаются оценить, безопасно ли потенциальное действие для выполнения в данном сценарии»,-сказал Синдхвани.

DeepMind также выпускает новые тесты и рамки для продвижения исследований в области безопасности в отрасли искусственного интеллекта. Это основано на прошлогоднем запуска «Конституции робота» Google DeepMind, набора правил безопасности ИИ, вдохновленных законами робототехники Исаака Асимова.

Google DeepMind работает с ведущими робототехниками, включая Applonik, Agile Robots, Advility Robotics, Бостонская динамика и зачарованные инструменты, в рамках своих усилий по созданию следующего поколения гуманоидных роботов. «Мы очень сосредоточены на создании интеллекта, который понимает физический мир и действует на него», — сказал Парада. «Мы рады использовать эти модели по нескольким вариантам осуществления и приложениям».