在代爾夫特理工大學(xué)的“網(wǎng)絡(luò)動(dòng)物園”中,無(wú)人機(jī)正在進(jìn)行爭(zhēng)分奪秒的競(jìng)賽,以測(cè)試為下一代太空任務(wù)設(shè)計(jì)的基于神經(jīng)網(wǎng)絡(luò)的人工智能控制系統(tǒng)的性能。
這項(xiàng)研究由歐空局先進(jìn)概念團(tuán)隊(duì)和代爾夫特理工大學(xué)微型飛行器實(shí)驗(yàn)室MAVLab共同開(kāi)展,詳情刊登在最新一期的《科學(xué)機(jī)器人》雜志上。
歐空局ACT科學(xué)協(xié)調(diào)員達(dá)里奧·伊佐指出:“通過(guò)長(zhǎng)期合作,我們一直在研究使用可訓(xùn)練神經(jīng)網(wǎng)絡(luò)來(lái)自主監(jiān)督各種高要求的航天器操作,例如行星際轉(zhuǎn)移、地面著陸和對(duì)接。”
“在太空中,必須盡可能高效地利用每一種機(jī)載資源——包括推進(jìn)劑、可用能源、計(jì)算資源,通常還有時(shí)間。這種神經(jīng)網(wǎng)絡(luò)方法可以實(shí)現(xiàn)最佳機(jī)載操作,提高任務(wù)的自主性和穩(wěn)健性。但在規(guī)劃實(shí)際太空任務(wù)之前,我們需要一種方法在現(xiàn)實(shí)世界中對(duì)其進(jìn)行測(cè)試。
“從那時(shí)起,我們就將無(wú)人機(jī)競(jìng)賽作為理想的健身環(huán)境,以便在真實(shí)的機(jī)器人平臺(tái)上測(cè)試端到端的神經(jīng)結(jié)構(gòu),以增強(qiáng)對(duì)它們未來(lái)在太空中使用的信心。”
無(wú)人機(jī)一直在代爾夫特理工大學(xué)Cyber??Zoo的既定路線上展開(kāi)角逐,爭(zhēng)奪最佳時(shí)間。Cyber??Zoo是一個(gè)10×10米的測(cè)試區(qū),由該大學(xué)航空航天工程學(xué)院維護(hù),該學(xué)院是ESA在這項(xiàng)研究中的合作伙伴。由人類駕駛的“微型飛行器”四軸飛行器與采用各種方式訓(xùn)練神經(jīng)網(wǎng)絡(luò)的自主飛行器交替進(jìn)行。
“航天器操作的傳統(tǒng)方式是在地面上詳細(xì)規(guī)劃,然后上傳到航天器上執(zhí)行,”ACT青年畢業(yè)生實(shí)習(xí)生SebastienOriger解釋道。“本質(zhì)上,當(dāng)涉及到任務(wù)制導(dǎo)和控制時(shí),制導(dǎo)部分發(fā)生在地面,而控制部分則由航天器承擔(dān)。”
然而,太空環(huán)境本質(zhì)上是不可預(yù)測(cè)的,可能存在各種不可預(yù)見(jiàn)的因素和噪音,例如重力變化、大氣湍流或與地面模型形狀不同的行星體。
無(wú)論出于何種原因,只要航天器偏離了預(yù)定路徑,其控制系統(tǒng)就會(huì)將其恢復(fù)到設(shè)定的軌跡。但問(wèn)題是,這種方法在資源方面可能非常昂貴,需要一整套強(qiáng)力校正。
Sebastien補(bǔ)充道:“我們的替代端到端制導(dǎo)與控制網(wǎng)絡(luò)(G&CNets)方法涉及航天器上的所有工作。航天器不再堅(jiān)持單一的既定路線,而是從當(dāng)前位置開(kāi)始不斷重新規(guī)劃其最佳軌跡,事實(shí)證明這樣做效率更高。”
在計(jì)算機(jī)模擬中,由相互連接的神經(jīng)元組成的神經(jīng)網(wǎng)絡(luò)(模仿動(dòng)物大腦的結(jié)構(gòu))在使用“行為克隆”進(jìn)行訓(xùn)練時(shí)表現(xiàn)良好,這種訓(xùn)練基于長(zhǎng)期接觸專家示例。但接下來(lái)的問(wèn)題是如何在現(xiàn)實(shí)世界中建立對(duì)這種方法的信任。此時(shí),研究人員轉(zhuǎn)向了無(wú)人機(jī)。
達(dá)里奧評(píng)論道:“盡管無(wú)人機(jī)飛行的速度更快、噪音更大,但無(wú)人機(jī)和航天器之間仍有相當(dāng)多的協(xié)同作用。”
“在競(jìng)賽中,最主要的稀缺資源顯然是時(shí)間,但我們可以利用時(shí)間替代太空任務(wù)可能必須優(yōu)先考慮的其他變量,例如推進(jìn)劑質(zhì)量。衛(wèi)星CPU非常受限,但我們的G&CNET卻出奇地小巧,可能最多可在內(nèi)存中存儲(chǔ)30,000個(gè)參數(shù),這僅需幾百千字節(jié)即可完成,總共涉及不到360個(gè)神經(jīng)元。”
為了達(dá)到最佳效果,G&CNet應(yīng)該能夠直接向執(zhí)行器發(fā)送命令。對(duì)于航天器來(lái)說(shuō),這些是推進(jìn)器,對(duì)于無(wú)人機(jī)來(lái)說(shuō),這些是螺旋槳。
“我們將G&CNets引入無(wú)人機(jī)所面臨的主要挑戰(zhàn)是模擬和現(xiàn)實(shí)中的執(zhí)行器之間的現(xiàn)實(shí)差距”,代爾夫特理工大學(xué)首席研究員ChristopheDeWagter表示。“我們通過(guò)在飛行過(guò)程中識(shí)別現(xiàn)實(shí)差距并教神經(jīng)網(wǎng)絡(luò)處理它來(lái)解決這個(gè)問(wèn)題。例如,如果螺旋槳的推力小于預(yù)期,無(wú)人機(jī)可以通過(guò)其加速度計(jì)注意到這一點(diǎn)。然后神經(jīng)網(wǎng)絡(luò)將重新生成命令以遵循新的最佳路徑。”
“無(wú)人機(jī)競(jìng)賽有整個(gè)學(xué)術(shù)界,一切都取決于贏得比賽,”塞巴斯蒂安說(shuō)。“對(duì)于我們的G&CNets方法而言,使用無(wú)人機(jī)代表著一種在規(guī)劃實(shí)際太空任務(wù)演示之前建立信任、開(kāi)發(fā)堅(jiān)實(shí)的理論框架和建立安全界限的方法。”
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!