有人聲稱機器學(xué)習技術(shù)有潛力改變醫(yī)療保健系統(tǒng),但《英國醫(yī)學(xué)雜志》發(fā)表的一項研究發(fā)現(xiàn),機器學(xué)習模型與傳統(tǒng)統(tǒng)計模型具有相似的性能,并且在對個體患者進行風險預(yù)測時具有相似的不確定性。
NHS 已投資 2.5 億英鎊(3.23 億美元;2.75 億歐元)將機器學(xué)習嵌入醫(yī)療保健領(lǐng)域,但研究人員表示,在使用模型為個體患者做出治療決策之前,應(yīng)評估模型內(nèi)部和模型之間的一致性(穩(wěn)定性)水平。
風險預(yù)測模型廣泛應(yīng)用于臨床實踐。他們使用統(tǒng)計技術(shù)以及有關(guān)人們的信息(例如年齡和種族)來識別那些患病風險較高的人,并就他們的護理做出決定。
前期研究發(fā)現(xiàn),QRISK3等傳統(tǒng)風險預(yù)測模型在人群層面具有非常好的模型性能,但對個體風險預(yù)測存在相當大的不確定性。
一些研究聲稱機器學(xué)習模型可以超越傳統(tǒng)模型,而另一些研究則認為它們無法提供預(yù)測背后可解釋的原因,可能導(dǎo)致不適當?shù)男袆印?/p>
更重要的是,機器學(xué)習模型經(jīng)常忽略審查——當患者在研究過程中失蹤(由于錯誤或無法聯(lián)系)時,模型假設(shè)他們沒有疾病,從而導(dǎo)致預(yù)測有偏差。
為了進一步探討這些問題,英國、中國和荷蘭的研究人員著手評估機器學(xué)習和統(tǒng)計技術(shù)在預(yù)測個體水平和人群水平心血管疾病風險方面的一致性以及審查對風險預(yù)測的影響。
他們使用 1998 年至 2018 年間在英格蘭 391 個全科診所注冊的 360 萬患者的數(shù)據(jù)評估了 19 種不同的預(yù)測技術(shù)(12 種機器學(xué)習模型和 7 種統(tǒng)計模型)。
標簽:
免責聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!