研究發(fā)現(xiàn)生成式人工智能尚無法可靠地讀取和提取醫(yī)療記錄中的臨床記錄信息 研究人員發(fā)現(xiàn)控制觸覺的新方法 關(guān)于禽流感如何跨越物種障礙的新見解 對(duì)自然界超級(jí)英雄鰻草的調(diào)查啟動(dòng)了加州橋梁項(xiàng)目 研究人員精確測量鈹原子的電磁屏蔽效應(yīng) 手被開水燙傷了應(yīng)該怎么辦?(手被開水燙傷怎么處理) 兒童畸胎瘤需要手術(shù)嗎(畸胎瘤需要手術(shù)嗎) 16號(hào)針頭是多少mm(獻(xiàn)血針頭那么粗疼嗎) 假肥大型肌營養(yǎng)不良怎么辦(假肥大型肌營養(yǎng)不良怎么治療) 女人閉經(jīng)以后還會(huì)懷孕嗎(女人閉經(jīng)了還會(huì)懷孕嗎) 排卵同房后幾天著床(同房后幾天著床) 大姨媽來黑色血是怎么回事(大姨媽黑色血是怎么回事) 17歲吃鈣片能長高嗎男孩(17歲吃鈣片能長高嗎) 感染hpv查血能查出來嗎(查血能查出梅毒嗎) 腿骨折要多少天腳面才不腫(腿腳骨折多久能好) 骨癌一般都長在哪三部位圖(早期骨癌一般是哪疼) 低壓多少正常范圍內(nèi)30-40(低壓多少正常) 用生姜擦頭皮有生發(fā)效果嗎(生姜擦龜頭能延時(shí)嗎) 食道癌手術(shù)全下來費(fèi)用是多少錢(食道癌手術(shù)全下來費(fèi)用是多少) 無痛人流手術(shù)要多久可以出院(無痛人流手術(shù)要多久) 紅霉素軟膏的作用和功效可以消腫嗎(紅霉素軟膏的作用和功效) 肝癌用中藥調(diào)理到底有沒有用?(肝癌中藥治療有用嗎) 女人骨盆前傾怎么矯正(骨盆前傾怎么矯正) 霉菌性陰炎和滴蟲性陰炎的癥狀(滴蟲性陰炎的癥狀) 兩個(gè)月嬰兒鞘膜積液會(huì)影響生育嗎(2個(gè)月嬰兒鞘膜積液能自愈嗎) 懷孕九周做春夢(mèng)宮縮會(huì)流產(chǎn)(孕9周做春夢(mèng)導(dǎo)致胎停怎么辦) 感冒吃什么菜好的最快最有效(感冒吃什么菜好) 四維過了胎兒心臟彩超有必要嗎(胎兒心臟彩超有必要嗎) 嗓子發(fā)炎怎么治療吃什么藥(嗓子發(fā)炎治療最有效的方法) 不插管無痛胃鏡怎么做的過程(無痛胃鏡怎么做的過程) 缺乏維生素d會(huì)導(dǎo)致胎停嗎(孕婦怎么補(bǔ)充維生素d) 舌尖疼吃什么藥最見效(舌尖疼是什么原因) 有了蕁麻疹如何治療(麻疹如何治療) 西葫蘆吃了有什么好處和壞處(吃西瓜的好處和壞處) 宮頸肥大用什么藥根治(宮頸肥大吃什么藥效果最好) 最后一顆牙拔了是種植牙好還是鑲牙好(種植牙好還是鑲牙好) 丙型肝炎的主要傳播途徑是什么(甲肝的主要傳播途徑是什么) 后背長痘痘是艾滋病嗎圖片(后背長痘痘是艾滋病嗎) 胰腺囊腫最好的治療方法(胰腺腫瘤有良性的嗎) 英達(dá)35價(jià)格(英達(dá)35的作用與功效) 高血壓患者眼睛模糊什么原因(高血壓引起眼睛模糊怎么辦) 直腸癌如何檢查發(fā)現(xiàn)(直腸癌如何檢查) 男性包皮不割有什么影響(包皮不割的影響) 左邊心臟一陣一陣的疼是怎么回事(心臟一陣一陣的疼是怎么回事) 20天的嬰兒黃疸值多少算正常(嬰兒黃疸值多少算正常) 孕婦可以吃山竹嗎對(duì)胎兒有影響嗎(孕婦可以吃山竹嗎) 川烏的功效及作用是什么呢(川烏的功效及作用是什么) 糖尿病患者可以吃什么水果(糖尿病患者能吃榴蓮嗎) 三個(gè)月的嬰兒大便發(fā)綠是怎么回事(嬰兒大便發(fā)綠怎么回事) 如何給寶寶斷夜奶最好呢(如何給寶寶斷夜奶最好)

研究發(fā)現(xiàn)生成式人工智能尚無法可靠地讀取和提取醫(yī)療記錄中的臨床記錄信息

導(dǎo)讀 將來,我們或許能夠使用大型語言模型 (LLM) 自動(dòng)讀取醫(yī)療記錄中的臨床記錄,并可靠高效地提取相關(guān)信息以支持患者護(hù)理或研究。但哥倫比亞...

將來,我們或許能夠使用大型語言模型 (LLM) 自動(dòng)讀取醫(yī)療記錄中的臨床記錄,并可靠高效地提取相關(guān)信息以支持患者護(hù)理或研究。但哥倫比亞大學(xué)梅爾曼公共衛(wèi)生學(xué)院最近的一項(xiàng)研究使用 ChatGPT-4 閱讀急診科入院記錄,以確定受傷的踏板車和自行車騎手是否戴了頭盔,結(jié)果發(fā)現(xiàn) LLM 尚無法可靠地做到這一點(diǎn)。該研究結(jié)果發(fā)表在JAMA Network Open 上。

在對(duì) 2019 年至 2022 年騎自行車、踏板車或其他微型交通工具時(shí)受傷的 54,569 名患者進(jìn)行急診就診的研究中,人工智能法學(xué)碩士 (AI LLM) 難以復(fù)制基于文本字符串搜索的方法從臨床記錄中提取頭盔狀態(tài)的結(jié)果。

只有當(dāng)提示包含基于文本字符串搜索的方法中使用的所有文本時(shí),LLM 才能表現(xiàn)良好。LLM 也很難在連續(xù)五天的每次試驗(yàn)中重復(fù)其工作,它在重復(fù)幻覺方面比在準(zhǔn)確工作方面做得更好。當(dāng)短語被否定時(shí),它尤其吃力,例如閱讀“w/o 頭盔”或“unhelmeted”并報(bào)告患者戴了頭盔。

大量醫(yī)學(xué)相關(guān)數(shù)據(jù)以書面臨床筆記的形式包含在電子病歷中,這是一種非結(jié)構(gòu)化數(shù)據(jù)。高效地讀取和提取這些筆記中的信息對(duì)于研究非常有用。

目前,可以使用簡單的字符串匹配文本搜索方法或通過更復(fù)雜的基于人工智能 (AI) 的方法(例如自然語言處理)從這些臨床記錄中提取信息。人們希望新的 LLM(例如 ChatGPT-4)能夠更快、更可靠地提取信息。

哥倫比亞大學(xué)梅爾曼學(xué)院流行病學(xué)教授、資深作者 Andrew Rundle 博士表示:“雖然我們看到使用生成式 AI LLM 進(jìn)行信息提取任務(wù)可能會(huì)提高效率,但可靠性和幻覺問題目前限制了它的實(shí)用性。”

“當(dāng)我們使用包含與頭盔相關(guān)的所有文本字符串的高度詳細(xì)的提示時(shí),ChatGPT-4 在某些日子可以從臨床記錄中提取準(zhǔn)確的數(shù)據(jù)。但是,定義和測試提示中必須包含的所有文本所需的時(shí)間以及 ChatGPT-4 無法日復(fù)一日地復(fù)制其工作,這表明 ChatGPT-4 尚未完成這項(xiàng)任務(wù)。”

Rundle 及其同事利用美國消費(fèi)品安全委員會(huì)國家電子傷害監(jiān)測系統(tǒng) 2019 年至 2022 年的公開數(shù)據(jù)(以 96 家美國醫(yī)院為樣本),分析了在電動(dòng)自行車、自行車、懸浮滑板和電動(dòng)滑板車事故中受傷患者的急診室記錄。他們將?? ChatGPT-4 對(duì)記錄的分析結(jié)果與使用更傳統(tǒng)的基于文本字符串的搜索生成的數(shù)據(jù)進(jìn)行了比較,并且對(duì)于 400 條記錄,他們將 ChatGPT 的分析與他們自己對(duì)記錄中臨床筆記的解讀進(jìn)行了比較。

這項(xiàng)研究建立在他們研究如何預(yù)防微型交通工具使用者(即騎自行車者、電動(dòng)自行車騎手、踏板車騎手)受傷的工作基礎(chǔ)之上。“頭盔的使用是傷害嚴(yán)重程度的一個(gè)關(guān)鍵因素,但在大多數(shù)急診科醫(yī)療記錄和事故報(bào)告中,有關(guān)頭盔使用的信息都隱藏在醫(yī)生或 EMS 受訪者撰寫的臨床筆記中。需要進(jìn)行大量研究才能可靠、高效地獲取這些信息,”該論文的主要作者、梅爾曼學(xué)院流行病學(xué)系博士后研究員凱瑟琳·伯福德 (Kathryn Burford) 說。

“我們的研究考察了法學(xué)碩士從臨床筆記中提取信息的潛力,臨床筆記是醫(yī)療專業(yè)人員和研究人員的豐富信息來源,”蘭德爾說。“但在我們使用 ChatGPT-4 時(shí),它無法可靠地為我們提供數(shù)據(jù)。”

合著者包括哥倫比亞大學(xué)梅爾曼公共衛(wèi)生學(xué)院的 Nicole G. Itzkowitz、哥倫比亞人口研究中心的 Ashley G. Ortega 和哥倫比亞社會(huì)工作學(xué)院的 Julien O. Teitler。

標(biāo)簽:

免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

最新文章