紐約州伊薩卡市——康奈爾大學研究人員磨練和推進的另一種統(tǒng)計方法可以使臨床試驗更加可靠和可信,同時還有助于解決科學界所謂的“可復制性危機”。
在本月發(fā)表在《美國國家科學院院刊》上的一篇新論文中,康奈爾大學的研究人員進一步研究了“脆弱性指數(shù)”,這是一種在醫(yī)學界獲得關注的方法,作為 p 值的補充,p 值是一種應用于科學的概率測量,自1920 年代,有時甚至不顧后果地引用作為良好結果的證據(jù)。
“臨床醫(yī)生相信,他們執(zhí)行的程序和協(xié)議是通過合理的臨床試驗得出的。少任何事情都會讓外科醫(yī)生感到緊張,這是理所當然的,”查爾斯·A·亞歷山大 (Charles A. Alexander) 統(tǒng)計科學教授、論文合著者馬丁·威爾斯(Martin Wells)說。“我們發(fā)現(xiàn),許多這些顯示出有希望的結果并發(fā)表在頂級期刊上的后續(xù)試驗都是脆弱的。這是這項研究帶來的令人不安的驚喜。”
這篇由康奈爾大學的統(tǒng)計學家、威爾康奈爾醫(yī)學院和多倫多大學的醫(yī)生撰寫的論文提出了一種新的統(tǒng)計工具包,使用脆弱性指數(shù)作為替代方法,以幫助研究人員更好地確定他們的試驗結果實際上是否可靠或者僅僅是偶然的產(chǎn)物。
“當你告訴全世界應該或不應該使用某種治療方法時,你希望該決定基于可靠的結果,而不是基于一兩個患者的結果可以以一種或另一種方式擺動的結果,”本杰明說貝爾博士'21,論文合著者,目前是羅徹斯特大學的博士后研究員。“這樣的結果可以被認為是脆弱的。”
[Randomized,臨床試驗,以測試效果是外科手術和藥物治療是必不可少的。為了解釋試驗結果的統(tǒng)計顯著性,幾十年來,研究人員轉向了一種經(jīng)常被誤解的衡量標準,即 p 值,以確定結果是否有價值或只是偶然發(fā)生。
但是,在過去的 15 年中,當單獨使用且沒有支持方法時,對 p 值可靠性的懷疑越來越多,特別是因為過去的試驗結果最初被認為是強大的,無法在后續(xù)試驗中復制。在2014 年使用脆性指數(shù)的一項研究中,研究人員分析了 400 項隨機臨床試驗,發(fā)現(xiàn)四分之一具有“統(tǒng)計顯著”p 值的試驗實際上具有低得驚人的脆性評分,表明結果不太可靠。
標簽:
免責聲明:本文由用戶上傳,與本網(wǎng)站立場無關。財經(jīng)信息僅供讀者參考,并不構成投資建議。投資者據(jù)此操作,風險自擔。 如有侵權請聯(lián)系刪除!