6 октомври, 2022

Изследователи от École Polytechnique Fédérale de Lausanne Швейцария и Тексаския университет в Остин (UT) разработиха интерфейс мозък-компютър (BCI), който позволява на хората да променят траекториите на движение на манипулатора на работа. Интерфейсната система използва интересно обучение с подсилване (IRL) и може да научи предпочитанията на потребителя от по-малко от пет демонстрации.

 

Списанието на Nature’s Communication Biology описва системата и набор от експерименти. Основната цел на изследването беше да се подпомогне парализирани пациенти чрез разработване на роботи, които могат да бъдат контролирани с помощта на BCI, обяснява Антъни Алфорд, мениджърът на група за развитие в Genesys Cloud Devices, в статия на InfoQ.

Софтуерът на робота включва полуавтономна рутина за избягване на препятствия с параметри, които се актуализират с помощта на IRL въз основа на потенциалите, свързани с грешки. Од Билард, водещ изследовател, коментира:

“Помощта от роботи може да помогне на хора с нараняване на гръбначния мозък да възстановят част от загубената си сръчност, тъй като роботът може да изпълнява задачи на тяхно място.”

BCI устройствата обикновено измерват невронната активност с помощта на вътрешни импланти или външни сензори като ЕЕГ електроди. Основната цел е да се преобразуват тези данни от сензора, който може да се използва като компютърен вход. Тъй като директното командване на робот манипулатор чрез BCI може да отнеме време и да е уморително, екипът избра да проучи как BCI може да се използва за коригиране на поведението на полуавтономен робот манипулатор.

Поради това системата настройва алгоритъма на робота за избягване на препятствия в отговор на потенциала на потребителя, свързан с грешки (ErrP). За да направят тази корекция, изследователите приложиха алгоритъм за обучение на IRL. Алгоритъмът научава както функцията за възнаграждение, така и оптималното действие от набор на демонстрации. Когато манипулаторът се приближи до препятствието, роботът ще се опита да избегне препятствието; ако потребителят е очаквал, че роботът няма да избегне препятствието, сигналът ErrP, открит от BCI, се използва за регулиране на функцията за възнаграждение и параметрите за избягване на препятствия.

В набор от експерименти изследователите откриха, че тяхната система може да идентифицира функцията за възнаграждение на потребителя само за три демонстрации. Те също така добавиха, че подходът е “стабилен спрямо естествената променливост и неоптималната производителност на ErrP декодера.”, полезно свойство, защото засичането на ЕЕГ може да бъде шумно.

Тагове: , , , , , , , , , , , , , , , , , , ,
Nikoleta Yanakieva Editor at DevStyleR International