從清理溢出物到提供食物,機器人正在被教導執(zhí)行日益復雜的家務勞動。許多這樣的家庭機器人學員都是通過模仿來學習的。它們被編程為復制人類引導它們完成的動作。
事實證明,機器人具有出色的模仿能力。但除非工程師也對它們進行編程以適應每一種可能的碰撞和推動,否則機器人不一定知道如何處理這些情況,除非從頂部開始執(zhí)行任務。
現(xiàn)在,麻省理工學院的工程師們的目標是讓機器人在面臨偏離訓練路徑的情況時掌握一些常識。他們開發(fā)了一種方法,將機器人運動數(shù)據(jù)與大型語言模型(LLM)的“常識知識”聯(lián)系起來。
他們的方法使機器人能夠在邏輯上將許多給定的家務任務解析為子任務,并根據(jù)子任務中的中斷進行物理調整,以便機器人可以繼續(xù)前進,而無需返回并從頭開始執(zhí)行任務,并且工程師無需顯式編程修復整個過程中所有可能的故障。
“模仿學習是實現(xiàn)家用機器人的主流方法。但是,如果機器人盲目模仿人類的運動軌跡,微小的錯誤就會積累起來,最終使其余的執(zhí)行脫軌。”麻省理工學院電氣工程系研究生王彥偉說和計算機科學(EECS)。“通過我們的方法,機器人可以自我糾正執(zhí)行錯誤并提高整體任務的成功率。”
Wang 和他的同事將在 5 月份的國際學習表征會議 (ICLR 2024)上展示一項研究,詳細介紹了他們的新方法。該研究的共同作者包括 EECS 研究生 Tsun-Hsuan Wang 和 Jiayuan Mao、麻省理工學院航空航天系 (AeroAstro) 博士后 Michael Hagenow 以及麻省理工學院航空航天系 HN Slater 教授 Julie Shah。
標簽:
免責聲明:本文由用戶上傳,如有侵權請聯(lián)系刪除!