SMU 研究與技術(shù)轉(zhuǎn)讓辦公室- 想象一下:您是一名護(hù)理人員,正在接聽(tīng)一位癥狀不常見(jiàn)的患者的緊急呼叫。由于這種罕見(jiàn)的表現(xiàn),在確定可能危及生命的疾病時(shí)會(huì)浪費(fèi)寶貴的時(shí)間。
SMU 計(jì)算與信息系統(tǒng)學(xué)院 (SCIS) 計(jì)算機(jī)科學(xué)副教授 Pradeep Varakantham 目前正在開(kāi)展一個(gè)項(xiàng)目,以幫助培訓(xùn)那些在“安全關(guān)鍵應(yīng)用程序”中處理預(yù)期和意外情況的人員。
“假設(shè)某人患有與腎臟有關(guān)的疾病,它的表現(xiàn)方式和您看到的癥狀類(lèi)型可能因人而異,”他解釋說(shuō)。“[我正在研究的] 系統(tǒng)將做的……是分析過(guò)去發(fā)生的所有腎臟相關(guān)疾病,然后它會(huì)嘗試混合和匹配它們,以便在訓(xùn)練期間生成可行的場(chǎng)景。”
什么是ATP?
Varakantham 教授是國(guó)家研究基金會(huì)在其人工智能新加坡計(jì)劃下資助的為期四年的項(xiàng)目“Trust to Train and Train to Trust: Agent Training Programs for Safety-Critical Environments”的首席研究員。該項(xiàng)目的主題是“人工智能系統(tǒng)通過(guò)培訓(xùn)非專(zhuān)家來(lái)幫助”。
該項(xiàng)目與新加坡民防部隊(duì) (SCDF) 合作,旨在開(kāi)發(fā)一個(gè)可解釋且值得信賴的 (ExpeRt) 人工智能或代理培訓(xùn)計(jì)劃 (ATP),用于培訓(xùn)模擬器。Varakantham 教授指出,現(xiàn)有的訓(xùn)練模擬器:
“……使用很少的固定(物理或虛擬)場(chǎng)景或理想化模擬器(考慮預(yù)期場(chǎng)景)。這種培訓(xùn)可能會(huì)給受訓(xùn)者帶來(lái)偏見(jiàn)(例如,由于在培訓(xùn)中只遇到少數(shù)場(chǎng)景),不能保證安全行為的學(xué)習(xí)等,導(dǎo)致使用培訓(xùn)模擬器的組織和受訓(xùn)者之間的信任缺失。”
最終產(chǎn)品的形式尚未確定,Varakantham 教授的目標(biāo)是對(duì)現(xiàn)有的 SCDF 員工進(jìn)行交叉培訓(xùn),這些員工可能不會(huì)一直執(zhí)行前線護(hù)理人員的職責(zé),也可以對(duì)正在執(zhí)行的護(hù)理人員進(jìn)行交叉培訓(xùn)。強(qiáng)化學(xué)習(xí)將成為 ATP 的核心功能。
“代理培訓(xùn)計(jì)劃基本上采用強(qiáng)化學(xué)習(xí)來(lái)生成場(chǎng)景,” Varakantham 教授詳細(xì)說(shuō)明。“它產(chǎn)生的每個(gè)場(chǎng)景就像它采取的一個(gè)行動(dòng)。如果它生成了一個(gè)場(chǎng)景并且受訓(xùn)人員已經(jīng)學(xué)習(xí)了該場(chǎng)景的技能,那么 ATP 就加 1。但是它生成了一個(gè)場(chǎng)景并且受訓(xùn)者沒(méi)有學(xué)習(xí),那么它是零。
“如果這個(gè)人在某種意義上忘記了該技能,即他們無(wú)法以之前學(xué)習(xí)的相同水平再次執(zhí)行該技能,那么這是負(fù)面的。從這個(gè)意義上說(shuō),這個(gè) ATP 要做的是以增加學(xué)習(xí)的方式生成場(chǎng)景。這個(gè)人正在學(xué)習(xí)的技能數(shù)量不斷增加。”
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!