ИИ изучает слова с точки зрения человеческого ребенка, используя кадры с головной камеры

Вид с воздуха на ребенка на четвереньках, играющего с кубиками

Младенцы могут начать изучать слова, обозначающие предметы, в возрасте от шести до девяти месяцев. В новом исследовании ИИ также смог сопоставить некоторые объекты с их названиями после обучения на видеозаписях с головной камеры, которую носил маленький ребенок.

Исследователи уже давно задаются вопросом, обладают ли человеческие младенцы врожденной способностью изучать язык, которая помогает им понимать значения слов и, в конечном итоге, понимать предложения. Большинство моделей искусственного интеллекта, обрабатывающих язык, таких как ChatGPT, перед тем, как начать функционировать, обучаются на миллионах или триллионах элементов. Однако дети изучают основы языка, услышав гораздо меньше слов.

Но недавнее исследование предполагает, что ИИ также сможет освоить язык, используя меньший набор подсказок. Обученная на визуальных изображениях и словах, снятых головной камерой на маленьком ребенке, модель искусственного интеллекта научилась правильно сопоставлять некоторые изображения объектов с их названиями, сообщают исследователи в этом месяце в журнале. Наука.

«Сегодняшним моделям не нужно столько входных данных, сколько они получают, чтобы сделать значимые обобщения», — говорит Бренден Лейк, соавтор исследования и специалист по компьютерной когнитивистике из Нью-Йоркского университета (NYU). Научный американецЭто Лорен Леффер. «Мы впервые показали, что можно научить модель ИИ изучать слова глазами и ушами одного ребенка».

Успех ИИ с этим ограниченным вводом данных предполагает, что врожденное понимание может не потребоваться для некоторых аспектов овладения языком.

«Для меня это действительно потрясло мое мировоззрение», — говорит Джесс Салливан, психолог развития из Скидмор-колледжа, который помогал собирать данные, но не участвовал в новом исследовании. Обзор технологий Массачусетского технологического институтаЭто Кассандра Уилльярд.

В исследовании использовалась существующая библиотека видеозаписей с камер, на которых запечатлены переживания одного ребенка. Ребенок по имени Сэм носил головную камеру в течение 61 часа в возрасте от шести до 25 месяцев, что составляет около 1 процента времени его бодрствования. Камера записывала видео и звук, пока ребенок занимался различными видами деятельности, включая игры, еду и чтение.

Камера зафиксировала около 250 000 различных слов. Исследователи предоставили своей модели отдельные видеокадры и расшифровку того, что люди говорили в то время.

Важно отметить, что модель представляла собой обычную простую нейронную сеть. «В сеть не встроено ничего, что давало бы модели подсказки о языке или о том, как язык должен быть структурирован», — говорит Вай Кин Вонг, соавтор исследования и научный сотрудник Нью-Йоркского университета. Вашингтон ПостКэролин Ю. Джонсон.

Дети начинают изучать свои первые слова в возрасте от шести до девяти месяцев, и установление этих связей является сложной проблемой. Например, младенцы должны выучить, что слово «чашка» относится к контейнеру для напитка, а не, в более общем плане, к любому предмету с отверстием или к любому предмету того же цвета, что и их чашка, объясняет Вонг в видео. .

«У любого слова есть бесконечное количество возможных значений», — говорит Лейк. Обзор технологий Массачусетского технологического института.

Несмотря на сложность своей задачи, ИИ добился определенного успеха. Чтобы проверить понимание, исследователи представили модели четыре изображения из видеозаписи с головной камеры и спросили, какое изображение соответствует определенному слову. Согласно данным, он идентифицировал правильное изображение в 62 процентах случаев. Новости природы«Элизабет Гибни.

Модель также смогла сопоставить выученные слова с репрезентативными изображениями, которые она никогда раньше не видела, например, с обычным изображением яблока, примерно в 35 процентах случаев.

Слова, включая «машина» и «кроватка», часто распознавались моделью, но ИИ с трудом справлялся с объектами, которые могли иметь больше вариаций, такими как «комната» и «игрушка».

Результаты показывают, как некоторые аспекты значения слова можно изучить по ассоциации, пишут авторы исследования.

«Я был одним из тех, кто думал, что проблема изучения языка бесконечно сложна и что невозможно выучить значение слова, не имея в уме какого-то специального механизма», — говорит Салливан. Научный американец. «Теперь я вижу, что, по крайней мере, в одном случае это возможно».

Тем не менее, некоторые ученые указывают на несколько недостатков исследования. «Есть еще некоторые вещи, которые сложнее сделать из статьи. Что это говорит нам о том, как дети на самом деле изучают слова, менее ясно», — говорит Джошуа Тененбаум, специалист по компьютерным когнитивистам из Массачусетского технологического института, который не участвовал в исследовании. Вашингтон Пост.

Исследование также было сосредоточено исключительно на названиях объектов — оно не показало, что ИИ может узнавать о глаголах, структуре и других аспектах языка с помощью видеозаписей с головной камеры, — говорит Ева Портеланс, исследователь компьютерной лингвистики из Института искусственного интеллекта Мила-Квебека. Канада, которая не участвовала в подготовке выводов, отмечает, что Научный американец.

Но благодаря будущим исследованиям подобные исследования обучения могут приоткрыть завесу тайны над загадочным процессом овладения языком.

«Потенциал дальнейших усовершенствований, позволяющих сделать модель более соответствующей сложностям человеческого обучения, огромен, открывая захватывающие возможности для прогресса в когнитивных науках», — Анируд Гоял, ученый в области машинного обучения из Монреальского университета в Канаде, не принимавший участия в исследованиях. исследование, рассказывает Новости природы.