Группа робототехников из Стэнфордского университета и Исследовательского института Toyota выяснила, что добавление аудиоданных к визуальным данным при обучении роботов способствует улучшению их навыков обучения. Об этом сообщает TechXplore.
Исследователи обратили внимание, что при обучении роботов на базе ИИ их практически всегда «кормят» большим объемом визуальной информации, полностью игнорируя сопутствующее звуковое сопровождение. Ученые задались вопросом, улучшится ли процесс обучения, если роботов оснастить микрофонами и позволить им собирать данные о том, как должен звучать выполняемый процесс.
Например, если робота обучают открывать коробку хлопьев и наполнять миску, ему может быть полезно слышать звуки открытия коробки и хлопьев, сыплющихся в посуду. Чтобы проверить эту гипотезу, исследователи разработали и провели четыре эксперимента по обучению роботов.
В первом эксперименте робот учился переворачивать бублик на сковороде с помощью лопатки. Во втором нужно было стирать изображение на белой доске ластиком. В третьем — пересыпать игральные кости из одной чашки в другую. В четвертом — выбрать нужный по размеру скотч из трех образцов и закрепить провод на пластиковой полоске с его помощью.
Во всех экспериментах использовался один робот с манипулятором-захватом. Обучение каждой задаче проводилось двумя способами: только с видео или с видео и аудио. Исследователи также варьировали внешние факторы: высоту стола, тип клейкой ленты и изображение на доске.
После проведения всех экспериментов исследователи сравнили результаты, оценив, насколько быстро, легко и точно роботы учились и выполняли задания. Оказалось, что добавление звука улучшило скорость и точность выполнения некоторых, задач, но не всех.
Например, добавление звука при пересыпании игральных костей значительно улучшило способность робота определять, остались ли они в чашке. Шум также помогал боту понять, прилагает ли он достаточное давление к ластику благодаря характерному звуку стирания. Однако звуковое сопровождение оказалось малоэффективным в задачах, где нужно было определить, перевернут ли бублик или полностью ли стерто изображение с доски.
Ученые считают, что добавление аудио к учебным материалам для роботов с искусственным интеллектом обеспечит лучшие результаты в некоторых областях.
Ранее исследователи из Стэнфорда создали модель искусственного интеллекта, которая помогает роботам наблюдать и повторять действия человека. Процесс обучения через наблюдение занимает около 40 часов.