Am putea crea roboți ca Rosie din The Jetsons
Ce tocmai sa întâmplat? Cercetătorii de la Massachusetts Institute of Technology (MIT) au dezvoltat o nouă abordare pentru a antrena roboți de uz general, inspirându-se din succesul modelelor mari de limbaj precum GPT-4. Numiți Transformatori Heterogene Pretrained (HPT), această abordare le permite roboților să învețe și să se adapteze la o gamă largă de sarcini – ceva care a fost dificil până în prezent.
Cercetarea ar putea duce la un viitor în care roboții nu sunt doar instrumente specializate, ci asistenți flexibili care pot învăța rapid abilități noi și se pot adapta circumstanțelor în schimbare, devenind cu adevărat asistenți robotici de uz general.
În mod tradițional, instruirea roboților a fost un proces consumator de timp și costisitor, necesitând inginerilor să colecteze date specifice pentru fiecare robot și sarcină în medii controlate. Drept urmare, roboții s-ar lupta să se adapteze la situații noi sau la obstacole neașteptate.
Noua tehnică a echipei MIT combină cantități mari de date eterogene din diverse surse într-un singur sistem capabil să predea roboților o gamă largă de sarcini.
În centrul arhitecturii HPT se află un transformator, un tip de rețea neuronală care procesează intrările de la diverși senzori, inclusiv datele de viziune și propriocepție, și creează un „limbaj” comun pe care modelul AI îl poate înțelege și din care poate învăța.
„În robotică, oamenii susțin adesea că nu avem suficiente date de antrenament. Dar, din punctul meu de vedere, o altă mare problemă este că datele provin din atât de multe domenii, modalități și hardware pentru roboti diferite”, a spus Lirui Wang, autorul principal. a studiului și un student absolvent de inginerie electrică și informatică (EECS) la MIT. „Munca noastră arată cum ai fi capabil să antrenezi un robot cu toți împreună.”
Co-autorii lui Wang includ un coleg absolvent al EECS Jialiang Zhao, cercetătorul Meta Xinlei Chen și autorul principal Kaiming He, profesor asociat în EECS și membru al Laboratorului de Informatică și Inteligență Artificială (CSAIL). Cercetarea va fi prezentată la Conferința privind sistemele de procesare a informațiilor neuronale.
Unul dintre avantajele cheie ale abordării HPT este capacitatea sa de a folosi un set masiv de date pentru preinstruire. Cercetătorii au compilat un set de date format din 52 de seturi de date cu peste 200.000 de traiectorii roboți din patru categorii, inclusiv videoclipuri și simulări cu demonstrații umane.
Această pregătire preliminară permite sistemului să transfere cunoștințe în mod eficient atunci când învață sarcini noi, necesitând doar o cantitate mică de date specifice sarcinii pentru reglare fină.
Atât în sarcinile simulate, cât și în cele din lumea reală, metoda HPT a depășit abordările tradiționale de antrenament de la zero cu peste 20 la sută. Sistemul HPT a demonstrat încă o performanță îmbunătățită chiar și atunci când s-a confruntat cu sarcini semnificativ diferite de datele de preantrenament.
„Această lucrare oferă o abordare nouă pentru formarea unei singure politici în mai multe variante de robot”, a spus David Held, profesor asociat la Institutul de Robotică al Universității Carnegie Mellon, care nu a fost implicat în studiu. „Acest lucru permite antrenamentul pe diverse seturi de date, permițând metodelor de învățare cu roboți să mărească în mod semnificativ dimensiunea seturilor de date pe care se pot antrena. De asemenea, permite modelului să se adapteze rapid la noile variante de roboți, ceea ce este important deoarece noi modele de roboți sunt produse în mod continuu. .”
Cercetătorii MIT își propun să îmbunătățească sistemul HPT prin explorarea modului în care diversitatea datelor îi poate crește performanța. Ei intenționează, de asemenea, să extindă capacitățile sistemului de a procesa date neetichetate, similar modului în care funcționează modelele de limbaj mari precum GPT-4.
Wang și colegii săi și-au stabilit un obiectiv ambițios pentru viitorul acestei tehnologii. „Visul nostru este să avem un creier robot universal pe care să-l poți descărca și folosi pentru robotul tău fără nicio pregătire”, a explicat Wang. „În timp ce suntem abia în stadiile incipiente, vom continua să insistăm și sperăm că scalarea va duce la o descoperire în politicile robotice, așa cum a făcut-o cu modelele mari de limbaj”.
Amazon Greater Boston Tech Initiative și Toyota Research Institute au finanțat parțial această cercetare.