從清理溢出物到提供食物,機(jī)器人正在被教導(dǎo)執(zhí)行日益復(fù)雜的家務(wù)勞動(dòng)。許多這樣的家庭機(jī)器人學(xué)員都是通過模仿來學(xué)習(xí)的。它們被編程為復(fù)制人類引導(dǎo)它們完成的動(dòng)作。
事實(shí)證明,機(jī)器人具有出色的模仿能力。但除非工程師也對(duì)它們進(jìn)行編程以適應(yīng)每一種可能的碰撞和推動(dòng),否則機(jī)器人不一定知道如何處理這些情況,除非從頂部開始執(zhí)行任務(wù)。
現(xiàn)在,麻省理工學(xué)院的工程師們的目標(biāo)是讓機(jī)器人在面臨偏離訓(xùn)練路徑的情況時(shí)掌握一些常識(shí)。他們開發(fā)了一種方法,將機(jī)器人運(yùn)動(dòng)數(shù)據(jù)與大型語言模型(LLM)的“常識(shí)知識(shí)”聯(lián)系起來。
他們的方法使機(jī)器人能夠在邏輯上將許多給定的家務(wù)任務(wù)解析為子任務(wù),并根據(jù)子任務(wù)中的中斷進(jìn)行物理調(diào)整,以便機(jī)器人可以繼續(xù)前進(jìn),而無需返回并從頭開始執(zhí)行任務(wù),并且工程師無需顯式編程修復(fù)整個(gè)過程中所有可能的故障。
“模仿學(xué)習(xí)是實(shí)現(xiàn)家用機(jī)器人的主流方法。但是,如果機(jī)器人盲目模仿人類的運(yùn)動(dòng)軌跡,微小的錯(cuò)誤就會(huì)積累起來,最終使其余的執(zhí)行脫軌。”麻省理工學(xué)院電氣工程系研究生王彥偉說和計(jì)算機(jī)科學(xué)(EECS)。“通過我們的方法,機(jī)器人可以自我糾正執(zhí)行錯(cuò)誤并提高整體任務(wù)的成功率。”
Wang 和他的同事將在 5 月份的國(guó)際學(xué)習(xí)表征會(huì)議 (ICLR 2024)上展示一項(xiàng)研究,詳細(xì)介紹了他們的新方法。該研究的共同作者包括 EECS 研究生 Tsun-Hsuan Wang 和 Jiayuan Mao、麻省理工學(xué)院航空航天系 (AeroAstro) 博士后 Michael Hagenow 以及麻省理工學(xué)院航空航天系 HN Slater 教授 Julie Shah。
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!