Робота с хлыстом обучили на ошибках
Результаты исследования были опубликованы на веб-сайте университета. Ученые создали новую модель обучения с подкреплением, основанную на использовании искусственного интеллекта и камер. Роботы были обучены повторять определенные действия, совершать ошибки и извлекать уроки из них, при этом использовались камеры и сенсоры для анализа ситуации, своих действий, взаимодействия с оператором и обратной связи. Один из участников исследования, Цзяньлань Ло, отметил, что на начальном этапе ему приходилось уделять значительное внимание помощи роботу и демонстрации примеров. Однако с каждой попыткой робот все лучше справлялся с задачей. В рамках эксперимента робот смог точно ударять по блокам в игре "дженга" и собирать мебель, что вызвало восхищение у Ло. Он отметил, что в будущем машины можно будет обучать различным механическим задачам, начиная от ремонта автомобилей и заканчивая приготовлением пищи. В конце ноября российские ученые создали первую открытую среду для исследований и разработки алгоритмов в области контекстного обучения с подкреплением - XLand-MiniGrid. Эта среда уже получила признание в международном исследовательском сообществе.
Источник и фото - lenta.ru
Больше новостей на сайтах Медиахолдинга