霽彩華年,因夢同行—— 慶祝深圳霽因生物醫(yī)藥轉化研究院成立十周年 情緒益生菌PS128助力孤獨癥治療,權威研究顯示可顯著改善孤獨癥癥狀 PARP抑制劑氟唑帕利助力患者從維持治療中獲益,改寫晚期卵巢癌治療格局 新東方智慧教育發(fā)布“東方創(chuàng)科人工智能開發(fā)板2.0” 精準血型 守護生命 腸道超聲可用于檢測兒童炎癥性腸病 迷走神經(jīng)刺激對抑郁癥有積極治療作用 探索梅尼埃病中 MRI 描述符的性能和最佳組合 自閉癥患者中癡呆癥的患病率增加 超聲波 3D 打印輔助神經(jīng)源性膀胱的骶神經(jīng)調節(jié) 胃食管反流病患者耳鳴風險增加 間質性膀胱炎和膀胱疼痛綜合征的臨床表現(xiàn)不同 研究表明 多語言能力可提高自閉癥兒童的認知能力 科學家揭示人類與小鼠在主要癌癥免疫治療靶點上的驚人差異 利用正確的成像標準改善對腦癌結果的預測 地中海飲食通過腸道細菌變化改善記憶力 讓你在 2025 年更健康的 7 種驚人方法 為什么有些人的頭發(fā)和指甲比其他人長得快 物質的使用會改變大腦的結構嗎 飲酒如何影響你的健康 20個月,3大平臺,300倍!元育生物以全左旋蝦青素引領合成生物新紀元 從技術困局到創(chuàng)新錨點,天與帶來了一場屬于養(yǎng)老的“情緒共振” “華潤系”大動作落槌!昆藥集團完成收購華潤圣火 十七載“冬至滋補節(jié)”,東阿阿膠將品牌營銷推向新高峰 150個國家承認巴勒斯坦國意味著什么 中國海警對非法闖仁愛礁海域菲船只采取管制措施 國家四級救災應急響應啟動 涉及福建、廣東 女生查分查出608分后,上演取得理想成績“三件套” 多吃紅色的櫻桃能補鐵、補血? 中國代表三次回擊美方攻擊指責 探索精神健康前沿|情緒益生菌PS128閃耀寧波醫(yī)學盛會,彰顯科研實力 圣美生物:以科技之光,引領肺癌早篩早診新時代 神經(jīng)干細胞移植有望治療慢性脊髓損傷 一種簡單的血漿生物標志物可以預測患有肥胖癥青少年的肝纖維化 嬰兒的心跳可能是他們說出第一句話的關鍵 研究發(fā)現(xiàn)基因檢測正成為主流 血液測試顯示心臟存在排斥風險 無需提供組織樣本 假體材料有助于減少靜脈導管感染 研究發(fā)現(xiàn)團隊運動對孩子的大腦有很大幫助 研究人員開發(fā)出診斷 治療心肌炎的決策途徑 兩項研究評估了醫(yī)療保健領域人工智能工具的發(fā)展 利用女子籃球隊探索足部生物力學 抑制前列腺癌細胞:雄激素受體可以改變前列腺的正常生長 肽抗原上的反應性半胱氨酸可能開啟新的癌癥免疫治療可能性 研究人員發(fā)現(xiàn)新基因療法可以緩解慢性疼痛 研究人員揭示 tisa-cel 療法治療復發(fā)或難治性 B 細胞淋巴瘤的風險 適量飲酒可降低高危人群罹患嚴重心血管疾病的風險 STIF科創(chuàng)節(jié)揭曉獎項,新東方智慧教育榮膺雙料殊榮 中科美菱發(fā)布2025年產品戰(zhàn)略布局!技術方向支撐產品生態(tài)縱深! 從雪域高原到用戶口碑 —— 復方塞隆膠囊的品質之旅
您的位置:首頁 >資訊 >

技術提高了大型語言模型的推理能力

像ChatGPT所支持的大型語言模型在起草法律摘要、分析客戶評論的情緒或將文檔翻譯成不同語言等任務上表現(xiàn)出色。

這些機器學習模型通常僅使用自然語言處理信息和回答查詢,這使得它們難以執(zhí)行需要數(shù)字或符號推理的任務。

例如,大型語言模型可能能夠記住并背誦美國歷任總統(tǒng)及其生日的列表,但如果問“1950年后當選的哪些美國總統(tǒng)出生在星期三?”,該模型可能會失敗(答案是吉米·卡特。)

麻省理工學院等機構的研究人員提出了一項新技術,使大型語言模型能夠通過生成程序來解決自然語言、數(shù)學和數(shù)據(jù)分析以及符號推理任務。

他們的方法稱為自然語言嵌入式程序(NLEP),涉及提示語言模型創(chuàng)建和執(zhí)行Python程序來解決用戶的查詢,然后將解決方案輸出為自然語言。

他們發(fā)現(xiàn),NLEP使大型語言模型能夠在各種推理任務上實現(xiàn)更高的準確率。這種方法也是可推廣的,這意味著一個NLEP提示可以重復用于多個任務。

NLEP還提高了透明度,因為用戶可以檢查程序以準確了解模型如何推理查詢,如果模型給出了錯誤的答案,則可以修復程序。

“我們希望人工智能能夠以透明和值得信賴的方式進行復雜的推理。雖然還有很長的路要走,但我們已經(jīng)證明,在大型語言模型中結合編程和自然語言的能力,是邁向未來人們能夠完全理解和信任人工智能模型內部發(fā)生的事情的一個非常好的潛在第一步,”麻省理工學院博士后、NLEP論文的共同主要作者HongyinLuo博士(2022年)表示。

與羅一起參與撰寫這篇論文的還有香港中文大學研究生張?zhí)烊A、北京大學本科生葛佳欣、麻省理工學院電子工程與計算機科學系助理教授、計算機科學與人工智能實驗室(CSAIL)成員YoonKim、CSAIL高級研究員兼口語系統(tǒng)小組負責人JamesGlass等。這項研究將在計算語言學協(xié)會北美分會的年度會議上發(fā)表。

使用程序解決問題

許多流行的大型語言模型的工作原理是,根據(jù)一些自然語言輸入預測下一個單詞或標記。雖然GPT-4等模型可用于編寫程序,但它們將這些程序嵌入自然語言中,這可能會導致程序推理或結果出現(xiàn)錯誤。

麻省理工學院的研究人員在NLEP中采用了相反的方法。他們讓模型完全用Python代碼生成分步程序,然后在程序中嵌入必要的自然語言。

NLEP是一個包含四個步驟的問題解決模板。首先,模型調用解決任務所需的必要包或函數(shù)。第二步涉及導入任務所需知識的自然語言表示(例如美國總統(tǒng)生日列表)。對于第三步,模型實現(xiàn)一個計算答案的函數(shù)。最后一步,模型將結果輸出為一行自然語言,并根據(jù)需要自動進行數(shù)據(jù)可視化。

“它就像一個數(shù)字計算器,只要程序正確,它就總能給出正確的計算結果,”羅說。

用戶可以輕松調查程序并直接修復代碼中的任何錯誤,而不需要重新運行整個模型來排除故障。

這種方法也比其他一些方法效率更高。如果用戶有許多類似的問題,他們可以生成一個核心程序,然后替換某些變量,而不需要重復運行模型。

為了促使模型生成NLEP,研究人員給了它一個編寫Python程序的總體指令,提供了兩個NLEP示例(一個是數(shù)學,一個是自然語言)和一個測試問題。

“通常,當人們進行這種小樣本提示時,他們仍然需要為每項任務設計提示。我們發(fā)現(xiàn),我們可以為許多任務設置一個提示,因為它不是教法學碩士解決一個問題的提示,而是教法學碩士通過編寫程序解決許多問題的提示,”羅說。

麻省理工學院-IBM沃森人工智能實驗室首席科學家LeonidKarlinsky表示:“使用語言模型對代碼進行推理,為工具使用、輸出驗證、對模型功能和思維方式的更有條理的理解等提供了許多機會。”

“這里沒有魔法”

在提示GPT-4解決一系列符號推理任務(例如跟蹤打亂的物體或玩24點游戲)以及指令跟蹤和文本分類任務時,NLEP的準確率超過90%。研究人員發(fā)現(xiàn),NLEP的準確率甚至比特定任務的提示方法高出30%。該方法還顯示出比開源LLM更好的性能。

除了提高大型語言模型的準確性之外,NLEP還可以改善數(shù)據(jù)隱私。由于NLEP程序在本地運行,因此敏感的用戶數(shù)據(jù)無需發(fā)送到OpenAI或Google等公司進行模型處理。

此外,NLEP可以使小型語言模型表現(xiàn)得更好,而無需為某項任務重新訓練模型,這可能是一個昂貴的過程。

“這里沒有什么魔法。我們沒有更昂貴或更花哨的語言模型。我們所做的就是使用程序生成而不是自然語言生成,我們可以讓它的表現(xiàn)更好,”羅說。

然而,NLEP依賴于模型的程序生成能力,因此該技術對于在有限數(shù)據(jù)集上訓練的較小模型效果不佳。未來,研究人員計劃研究使較小語言模型生成更有效的NLEP的方法。此外,他們還希望研究提示變化對NLEP的影響,以增強模型推理過程的穩(wěn)健性。

標簽:

免責聲明:本文由用戶上傳,與本網(wǎng)站立場無關。財經(jīng)信息僅供讀者參考,并不構成投資建議。投資者據(jù)此操作,風險自擔。 如有侵權請聯(lián)系刪除!

最新文章