SMU 研究與技術(shù)轉(zhuǎn)讓辦公室- 想象一下:您是一名護理人員,正在接聽一位癥狀不常見的患者的緊急呼叫。由于這種罕見的表現(xiàn),在確定可能危及生命的疾病時會浪費寶貴的時間。
SMU 計算與信息系統(tǒng)學院 (SCIS) 計算機科學副教授 Pradeep Varakantham 目前正在開展一個項目,以幫助培訓那些在“安全關(guān)鍵應(yīng)用程序”中處理預(yù)期和意外情況的人員。
“假設(shè)某人患有與腎臟有關(guān)的疾病,它的表現(xiàn)方式和您看到的癥狀類型可能因人而異,”他解釋說。“[我正在研究的] 系統(tǒng)將做的……是分析過去發(fā)生的所有腎臟相關(guān)疾病,然后它會嘗試混合和匹配它們,以便在訓練期間生成可行的場景。”
什么是ATP?
Varakantham 教授是國家研究基金會在其人工智能新加坡計劃下資助的為期四年的項目“Trust to Train and Train to Trust: Agent Training Programs for Safety-Critical Environments”的首席研究員。該項目的主題是“人工智能系統(tǒng)通過培訓非專家來幫助”。
該項目與新加坡民防部隊 (SCDF) 合作,旨在開發(fā)一個可解釋且值得信賴的 (ExpeRt) 人工智能或代理培訓計劃 (ATP),用于培訓模擬器。Varakantham 教授指出,現(xiàn)有的訓練模擬器:
“……使用很少的固定(物理或虛擬)場景或理想化模擬器(考慮預(yù)期場景)。這種培訓可能會給受訓者帶來偏見(例如,由于在培訓中只遇到少數(shù)場景),不能保證安全行為的學習等,導致使用培訓模擬器的組織和受訓者之間的信任缺失。”
最終產(chǎn)品的形式尚未確定,Varakantham 教授的目標是對現(xiàn)有的 SCDF 員工進行交叉培訓,這些員工可能不會一直執(zhí)行前線護理人員的職責,也可以對正在執(zhí)行的護理人員進行交叉培訓。強化學習將成為 ATP 的核心功能。
“代理培訓計劃基本上采用強化學習來生成場景,” Varakantham 教授詳細說明。“它產(chǎn)生的每個場景就像它采取的一個行動。如果它生成了一個場景并且受訓人員已經(jīng)學習了該場景的技能,那么 ATP 就加 1。但是它生成了一個場景并且受訓者沒有學習,那么它是零。
“如果這個人在某種意義上忘記了該技能,即他們無法以之前學習的相同水平再次執(zhí)行該技能,那么這是負面的。從這個意義上說,這個 ATP 要做的是以增加學習的方式生成場景。這個人正在學習的技能數(shù)量不斷增加。”
標簽:
免責聲明:本文由用戶上傳,與本網(wǎng)站立場無關(guān)。財經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風險自擔。 如有侵權(quán)請聯(lián)系刪除!