ТехнологииОблачные технологии будут обучать роботов (+Видео)

Облачные технологии будут обучать роботов (+Видео)

Роботы будут активно использовать общие данные, чтобы эффективней осваивать и совершенствовать навыки

Люди общаются между собой, чтобы использовать знания других и осваивать навыки быстрее. Приобретенный опыт помогает нам развивать свою интуицию и позволяет эффективнее справляться с поставленными задачами в повседневной жизни. Вдохновленные этим фактом,  Google Research, DeepMind (лаборатория искусственного интеллекта в Великобритании), и Google X решили помочь роботам делится своим опытом. Разделив процесс обучения среди нескольких роботов, исследовательская группа значительно ускорила приобретение и обмен навыками общего назначения между ними.  

Обучение: как и почему?

Использование искусственной нейронной сети позволяет нам научить робота достигать цель, анализируя результат его предыдущего опыта. Робот может действовать случайным образом с применением метода проб и ошибок. Он проверяет результат каждого испытания и, если удовлетворительно, фокусирует внимание на аналогичных экспериментах в течение следующих попыток. Сопоставляя  каждый опыт с полученным результатом, робот постепенно сможет определить эффективный/оптимальный способ достижения цели.

Для того, чтобы научить робота, необходимо обладать колоссальным опытом, что само по себе подразумевает достаточно трудоемкий процесс.  Например, чтобы манипулятор научился поднимать объекты, ему необходимо сделать не менее 800 000 захватов. И это лишь начало процесса его обучения.

В действительности это обучение отнимает много времени, но стоит отметить и интересные результаты. Роботы, которые предназначены для выполнения определенных заранее действий или взаимодействия с предварительно определенными объектами, не могут оперативно реагировать на изменения окружающей среды. Вместе с тем, робот, который проходит через процесс обучения, развивает способности в зависимости от приобретенных знаний и навыков. В этом случае, робот проявляет способность адаптироваться к незначительным корректировкам извне.

Для снижения временных затрат исследователи Google решили позволить роботам делиться приобретенным опытом, объединив усилия в единую концепцию под названием  «облачная робототехника». Каждый робот помещает свой собственный опыт на сервере и принимает с сервера последнюю версию модели обучения, которая является совместным результатом коллективной работы группы роботов. Эффективно и оперативно роботы учат друг друга, как выполнить определенную задачу.  Применение «облачных» технологий значительно сокращает время, необходимое для обучения всей цепочки в сети.

Предыдущий эксперимент Google совместного обмена данными

При осуществлении попытки научить роботизированный манипулятор схватить объект, команда Google заметила, что роботы предварительно развивали «хватательное поведение». Они могли оттолкнуть предмет подальше, чтобы извлечь определенный объект из группы, а затем схватить его. Кроме того, роботы научились различать мягкие и твердые предметы. Исследовательская группа достигла таких результатов посредством представленной роботам возможности обучать друг друга, а не программировать их до взаимодействия с объектами.

В марте прошлого года командой Google был проведен эксперимент, в котором 14 оснащенных камерами роботов попробовали собирать объекты. Деятельность роботов контролировалась с помощью камер, а полученный результат был использован для системы глубинного машинного обучения, основанной на базе сверхточной нейронной сети (СНС).

Совместное использование данных позволило увеличить производительность процесса обучения. Каждый робот экспериментировал в различных условиях. Например, исследовательская группа изменяла параметры, такие как положение камеры, освещение и аппаратный захват для каждого робота. Эти преднамеренные изменения заставили роботов  найти более надежное решение и приспособиться к изменениям внешней среды. Тем не менее, маловероятно, что система будет по-прежнему успешно работать с существенно измененными условиями.

В другом эксперименте, проведенном недавно, команда Google исследует построение общей модели обмена данными, предоставляя для решения задачу открытия двери.  Роботы повторяют эксперимент при 3 различных условиях:

1.       Обучение с подкреплением (метод проб и ошибок)

В первом эксперименте роботы на общей нейронной сети просто полагаются на обучение с подкреплением, или метод проб и ошибок. Исследователи применяют препятствия, чтобы нейронные сети быстрее формировали необходимые данные. Сервер отслеживает результат испытаний и помогает роботам прийти к лучшему решению.

Для открытия дверей в первый раз роботизированному манипулятору потребовалось около 20 минут. Тем не менее, в течение трех часов, они выясняют, как аккуратно взяться за ручку, повернуть ее, а затем потянуть, чтобы открыть дверь. Хотя роботы успешно справились с открытием двери, совсем не обязательно  четкая модель этой задачи была построена в их понимании. 



2.       Обучение на основе прогнозной модели

Во втором эксперименте разработана и испытана модель прогнозирования. Ученые предоставляют роботам  поднос с повседневными предметами. Манипулируя и перемещая  предметы, роботы формируют в своем понимании модель, которая помогает им каким-то образом предсказать, что может произойти при задании определенного курса действий. Причинно-следственная модель снова рассматривается в контексте совместного участия роботов в эксперименте.

Применение исследователями компьютерного интерфейса, который показывает тестовую среду, позволяет указать роботам конкретное место, на которое необходимо переместить объект. Роботы применяют прогнозную модель, чтобы определить оптимальный порядок действий для достижения этой цели.



3.       Обучение под руководством человека

Заключительный эксперимент призван помочь роботам получить знания для овладения необходимым навыком непосредственно от человека. В этом эксперименте исследователь берет робота буквально «за руку», оказывается физическое воздействие с целью демонстрации действий, необходимых для того, чтобы добраться до двери и открыть ее.

Последовательность действий анализируется и превращается в нейронную сеть, которая формирует основу последующего обучения роботов. Затем, роботам предоставляется возможность  открыть дверь самостоятельно. Опять же, роботы могут делиться своим опытом друг с другом. 

 «Облачная робототехника» может обеспечить роботов «быстро загружаемым интеллектом». Использование данного метода позволит в скором времени засвидетельствовать роботов, способных к обучению и реализации более сложных задач, чем  просто открыть дверь. В то время, как людям необходимо много времени для усвоения знаний, полученных извне, роботы будут иметь возможность разместить полученные данные в общей нейронной сети, чтобы мгновенно изучить необходимый навык у «роботизированного коллеги» в своей группе.

 

 

Автор: Вадим Егунов: 26.01.2017

Источник: Allaboutcircuits

 



 



 

 

 



comments powered by HyperComments
Узнать цену / Купить
Робот
Ваше имя *
Название организации *
Телефон *
Email *
Введите код с картинки:
Введите код
 Принимаю политику конфиденциальности