
Исследователи из Калифорнийского университета в Беркли представили революционный метод обучения роботов, который позволяет им быстро осваивать сложные задачи, такие как игра в дженгу, сборка материнских плат и даже замена ремня ГРМ. Новая технология, сочетающая искусственный интеллект и машинное обучение, значительно ускоряет процесс обучения, превращая роботов из новичков в экспертов всего за несколько часов.
Разработка принадлежит команде лаборатории робототехнического ИИ под руководством Сергея Левина. Метод основан на комбинации двух подходов: обучение с подкреплением, при котором робот учится на своих ошибках, получая обратную связь от датчиков и камер, и прямое человеческое руководство, когда оператор корректирует действия робота в реальном времени.
Робот начинает с изучения основ задачи, а затем постепенно совершенствует свои навыки, практикуясь в реальных условиях. Например, если робот выполняет движение неправильно, человек-оператор может использовать специальное устройство, чтобы скорректировать его действия. Эти данные сохраняются в памяти робота, что позволяет ему улучшать свою модель выполнения задачи.
Роботу требуется все меньше человеческого вмешательства по мере обучения. Вначале мне приходилось активно помогать ему, но уже через несколько часов он справлялся практически самостоятельно.

Чтобы проверить эффективность нового метода, исследователи предложили роботу выполнить ряд задач, требующих высокой точности и ловкости. Среди них были:
Игра в дженгу: робот использовал короткий шнур для извлечения блоков из башни, что требует тонкого контроля силы и точности.
Переворачивание яйца на сковороде: задача, которая кажется простой для человека, но крайне сложна для робота из-за хрупкости объекта.
Сборка материнской платы: процесс, требующий ювелирной точности и понимания сложных инструкций.
Сборка мебели: тумба из IKEA собрана за несколько минут.
Замена ремня ГРМ: одна из самых сложных задач, поскольку роботу приходилось учитывать множество переменных, включая гибкость материала и изменяющиеся условия.
Особое внимание исследователи уделили игре в дженгу. Эта задача, сложная даже для опытных игроков, стала настоящим вызовом для робота. Физика взаимодействия блоков дженги крайне сложна для моделирования, поэтому обучение в реальном мире оказалось ключевым фактором успеха. После применения нового метода робот смог выполнить задачу с 100%-ной точностью.
Новый метод обучения открывает широкие возможности для применения роботов в реальном мире. Традиционно роботы программируются для выполнения конкретных задач в контролируемых условиях, но новый подход позволяет им адаптироваться к изменяющимся условиям и осваивать новые навыки гораздо быстрее.
Это особенно важно для таких областей, как производство, где роботы могут выполнять сложные задачи, такие как сборка электроники или ремонт автомобилей. Кроме того, метод может быть полезен в бытовой робототехнике, где машины должны взаимодействовать с хрупкими или нестандартными объектами.
Наш метод позволяет роботам учиться так же, как людям — методом проб и ошибок, но с поддержкой ИИ и человеческого опыта.
В ближайшие годы команда планирует расширить спектр задач, которые могут выполнять роботы, а также улучшить их способность к самостоятельному обучению.
Читайте также нашу статью о том, как роботы-гуманоиды танцуют на китайском новогоднем фестивале.