Исследователи до сих пор не всегда понимают принципы работы алгоритмов машинного обучения – поэтому технологию пока сложно применять в сложных и рискованных проектах, таких как автономное вождение. Ученые из Инженерного колледжа Бостонского университета в США пытаются решить эту проблему, они обучили двух роботов вместе готовить и подавать хот-доги.
Новый подход представляет собой сочетание машинного обучения и формальных методов, которые обычно применяются, чтобы гарантировать безопасность, например, в аэрокосмической отрасли и программах для защиты от киберугроз. Речь идет о двух кардинально разных методах, которые сложно сочетать с математической точки зрения и перевести в форму, понятную роботу.
Команда ученых под руководством Калина Бельты, преподавателя инженерной механики, систем, электроники и компьютерных технологий, использовала способ машинного обучения, который называется обучением с подкреплением (reinforcement learning). В рамках этой схемы, когда компьютер успешно справляется с заданием, он получает условную награду. При этом стадии процесса заданы в алгоритме «базовых знаний», но точный способ их выполнения не запрограммирован. Совершенствуясь в выполнении задачи, робот получает все больше наград – такой механизм стимулирует систему учиться наиболее эффективным способам работы, в данном случае, приготовления хот-дога.
Сочетание базовых знаний с алгоритмом обучения с подкреплением и формальными методами лежит в основе инновации команды из Бостонского университета. Благодаря такой совокупности подходов ученые смогли ускорить процесс обучения роботов и обеспечить безопасность приготовления и подачи хот-догов. Бельта предлагает рассматривать этот проект как доказательство работоспособности общей концепции и рассчитывает, что в будущем подход можно будет адаптировать для других сложных задач, таких как автономное вождение.
Источник: robogeek.ru