«Сбер» и Microsoft разработали ИИ-систему управления роботами

07.12.2020

Она может применяться в различных сферах – от логистики до проведения спасательных операций.

«Сбер» и исследовательское подразделение Microsoft Research подвели итоги совместного проекта, анонсированного в октябре 2019 года.

Разработанная ИИ-система дает возможность обучить роботов манипулировать физическими объектами непостоянной формы практически так, как это делает человек. Ключевой целью исследовательского проекта была разработка решения, способного взаимодействовать с людьми, освобождая их от механически сложной рутинной работы и обеспечивая высокий уровень безопасности. Кроме того, это один из первых примеров переноса подобной технологии из симуляции в реальный мир.

Работа над проектом осуществлялась в Лаборатории робототехники «Сбера» в Москве и в Microsoft в Беркли и Редмонде, США, и в совокупности длилась больше года, с мая 2019 года по май 2020.

Исследовательская группа состояла из 8 человек. Их практической задачей было разработать технологию выгрузки с помощью робота-манипулятора инкассаторских мешков с монетами весом до 6 кг из мобильных тележек для их последующей обработки в счетных машинах. В отличие от захвата твердотельных объектов, манипуляции объектами непостоянной формы из-за подвижного центра тяжести требуют постоянного вычисления положения и ориентации захватного устройства в каждом отдельном случае. Для расчета и предсказания этих параметров были применены методы глубокого обучения и обучения с подкреплением Испытания продемонстрировали успешность выгрузки мешков с первого раза в более 95% в реальных условиях.

Процесс работы над проектом проходил в три этапа. Первый – разработка реалистичной симуляции робототехнической установки и объектов манипуляции – деформируемых мешков с монетами с учетом их физических характеристик. Вторым этапом была интеграция симуляторов с фреймворком машинного обучения с подкреплением и проведение экспериментов в симуляционной среде с обучением интеллектуального агента управлению виртуальным роботом. Для этого исследователями был применен подход machine teaching («обучение машин»). Методика предполагает не только обучение посредством взаимодействия алгоритма со средой, как в классическом обучении с подкреплением, но и использование «подсказок» от человека. На этом этапе необходимо было прописать правильные опорные точки для алгоритма, на основе которых он сможет обучаться. Это позволяет значительно ускорить процесс и сделать его более эффективным. На завершающем третьем этапе обученного в симуляторах интеллектуального агента перенесли непосредственно на физического робота. В результате в Лаборатории робототехники «Сбера» были успешно протестированы реальные манипуляции по разгрузке тележки с мешками монет роботом.

Создатели системы уверены, что подобная технология может быть востребована в широком ряде сфер. Особенно целесообразно ее применение для решения тех задач, где человек подвергается опасности или должен прилагать чрезвычайные физические усилия, например, в спасательных операциях, нефтедобыче, логистике и т.д. – везде, где необходимо совершать действия с объектами непостоянной формы.

Microsoft Сбер