新框架允許機(jī)器人通過在線人類演示視頻進(jìn)行學(xué)習(xí) 太空風(fēng)暴警報(bào)的新曙光或有助于保護(hù)地球科技 盆腔炎怎么治療才能徹底治愈同房脹痛感(盆腔炎怎么治療) 阿膠的作用和功效圖片(阿膠的作用和功效) 寶寶長濕疹怎么辦最快最有效(寶寶長濕疹怎么辦) 下頜角整形副作用(下頜角整形的危害) 孕晚期屬于哪幾個月(孕晚期是指哪幾個月) 乳腺炎乳腺增生怎么治療(乳腺增生怎么治療) 瘊子怎么治療(痱子怎么治療) 假體隆胸多久需要取出手術(shù)(假體隆胸多久需要取出) 不懷孕有啥癥狀(不懷孕的癥狀有哪些) 孕婦感冒吃什么藥效果比較好(孕婦感冒吃什么藥) 腳跟麻疼是怎么回事呀(腳跟痛是怎么回事) 洗牙好不好有什么壞處(洗牙好不好) 銀屑病治療藥物有哪些(銀屑病治療) 洋姜的功效與作用及禁忌癥(洋姜的功效與作用及禁忌) 夜交藤的功效和作用圖片(夜交藤的功效和作用) 黃芪的功效是什么呢(黃芪的功效是什么) 早產(chǎn)的癥狀是什么(早產(chǎn)的癥狀有哪些) 腳涼怎么治療效果好(腳涼是什么原因怎么治療) 催產(chǎn)素有什么作用和副作用(催產(chǎn)素有什么作用) 聚甲酚磺醛栓有用嗎(聚甲酚磺醛陰道栓的功效與作用) 經(jīng)期前癥狀有哪些表現(xiàn)(經(jīng)期前癥狀) 近視如何治療比較好(近視的治療方法是什么) 小兒哮喘的典型癥狀(小兒哮喘癥狀有哪些) 疼痛怎么形成的(疼痛是怎么產(chǎn)生的) 低血糖怎么辦能治好嗎(低血糖怎么辦) 什么是尿毒癥透析能活多久(什么是尿毒癥透析) 為什么頻繁打嗝停不下來(為什么頻繁打嗝) 急性咽喉炎最好的治療方法(急性咽喉炎治療方法) 胃病前期征兆有哪些(胃癌晚期的癥狀) 嬰兒大便的顏色是什么的(嬰兒大便顏色什么樣) 化妝品過敏怎么辦臉部用什么藥膏好(化妝品過敏怎么辦臉部用什么藥) 臉上長膿包吃什么藥比較好(臉上長膿包用什么藥膏) 怎么樣讓皮膚變白 簡單方法男(怎么樣讓皮膚變白) 老年人失眠怎么辦吃什么藥(老年人失眠怎么辦) 哺乳期感冒可以吃藥嗎可以喂奶嗎(哺乳期感冒可以吃藥嗎) 乳頭顏色變淺怎么回事(乳頭顏色深代表什么) 下巴一直長痘怎么回事(下巴一直長痘怎么辦) 西黃丸能長期服用嗎有什么副作用(西黃丸能長期服用嗎) 病毒性耳鳴有什么癥狀(耳鳴有什么癥狀) 香蕉的功效與作用禁忌(香蕉的功效) 激素性皮炎早期癥狀(激素性皮炎是怎么回事) 人工耳蝸的定義(什么叫人工耳蝸) 什么是鱗狀細(xì)胞癌能治好嗎(什么是鱗狀細(xì)胞癌) 尿常規(guī)里的電導(dǎo)率高是什么意思(尿常規(guī)電導(dǎo)率高什么意思) 保胎怎么保胎(怎么保胎最好) 右脛骨是哪個部位圖片(右脛骨是哪個部位) 小兒流鼻血是怎么回事中醫(yī)(小兒流鼻血是怎么回事)
您的位置:首頁 >國內(nèi)科研 >

新框架允許機(jī)器人通過在線人類演示視頻進(jìn)行學(xué)習(xí)

導(dǎo)讀 要想在現(xiàn)實(shí)環(huán)境中成功部署,機(jī)器人必須能夠可靠地完成各種日常任務(wù),從家務(wù)到工業(yè)流程。它們可以完成的一些任務(wù)包括操縱織物,例如折疊衣服...

要想在現(xiàn)實(shí)環(huán)境中成功部署,機(jī)器人必須能夠可靠地完成各種日常任務(wù),從家務(wù)到工業(yè)流程。它們可以完成的一些任務(wù)包括操縱織物,例如折疊衣服放入衣柜或幫助行動不便的老年人在社交活動前打領(lǐng)帶。

開發(fā)能夠有效處理這些任務(wù)的機(jī)器人迄今為止已被證明是相當(dāng)具有挑戰(zhàn)性的。許多用于訓(xùn)練機(jī)器人進(jìn)行織物操作任務(wù)的方法都依賴于模仿學(xué)習(xí),這是一種使用視頻、動作捕捉鏡頭和人類完成相關(guān)任務(wù)的其他數(shù)據(jù)來訓(xùn)練機(jī)器人控制的技術(shù)。

雖然其中一些技術(shù)取得了令人鼓舞的成果,但要取得良好效果,它們通常需要大量的人類演示數(shù)據(jù)。這些數(shù)據(jù)可能成本高昂且難以收集,而現(xiàn)有的開源數(shù)據(jù)集并不總是包含與訓(xùn)練其他計(jì)算技術(shù)(如計(jì)算機(jī)視覺或生成式 AI 模型)一樣多的數(shù)據(jù)。

新加坡國立大學(xué)、上海交通大學(xué)和南京大學(xué)的研究人員最近介紹了一種替代方法,可以通過人類演示來增強(qiáng)和簡化機(jī)器人算法的訓(xùn)練。這種方法在arXiv上預(yù)先發(fā)表的一篇論文中概述,旨在利用每天在線發(fā)布的大量視頻,將其用作日常任務(wù)的人類演示。

“這項(xiàng)工作始于一個簡單的想法,即建立一個系統(tǒng),讓機(jī)器人利用網(wǎng)上無數(shù)的人類演示視頻來學(xué)習(xí)復(fù)雜的操作技能,”論文合著者彭偉昆告訴 Tech Xplore。“換句話說,給定一個任意的人類演示視頻,我們希望機(jī)器人完成視頻中顯示的相同任務(wù)。”

雖然之前的研究也引入了利用視頻片段的模仿學(xué)習(xí)技術(shù),但他們使用的是特定領(lǐng)域的視頻(即人類在機(jī)器人稍后將處理任務(wù)的同一環(huán)境中完成特定任務(wù)的視頻),而不是在任何環(huán)境或設(shè)置中收集的任意視頻。

另一方面,彭和他的同事開發(fā)的框架旨在讓機(jī)器人能夠從網(wǎng)上找到的任意演示視頻中進(jìn)行模仿學(xué)習(xí)。

該團(tuán)隊(duì)的方法有三個主要組成部分,即 Real2Sim、Learn@Sim 和 Sim2Real。第一個組成部分是該框架的核心和最重要的部分。

標(biāo)簽:

免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!

最新文章