32位能用什么剪輯軟件(適合32位系統(tǒng)的視頻剪輯軟件) 如何使用支付寶里有的功能去超市能讓你更省錢?(支付寶如何在超市使用) 如何使用淘寶點外賣服務(wù) (如何使用淘寶點外賣服務(wù)中心) 酚類化合物有哪些性質(zhì)(酚類化合物有哪些呀) 蘋果id充值怎么充(蘋果id充值不成功怎么辦) 淘寶怎么付錢(淘寶支付) 拋光磚和拋釉磚的區(qū)別哪個好(拋光磚和拋釉磚的優(yōu)缺點) 大理劍川沙溪旅游攻略(大理古城到劍川沙溪古鎮(zhèn)坐什么車) 古籍?dāng)?shù)字化步驟詳解(古籍?dāng)?shù)字化定義) 極地女神和女皇哪個好(極地女神) 淘寶代練店怎么開(淘寶代練店怎么開店) DNF(地下城與勇士) 真野豬 怎么打經(jīng)驗分享(DNF真野豬怎么打) 網(wǎng)絡(luò)線上培訓(xùn)系統(tǒng)如何進行課程管理?(網(wǎng)絡(luò)線上培訓(xùn)系統(tǒng)如何進行課程管理教學(xué)) 用C語言編寫 打漁曬網(wǎng)問題(用c語言編寫三天打魚,兩天曬網(wǎng)) 契丹人是中國人嗎(女真人是什么民族) DNF如何獲得無色小晶塊最合適(dnf無色大晶塊怎么得) 21部共和國名將電影(央視的共和國名將系列電影共有幾部) 怎么知道電腦安裝了監(jiān)視軟件(怎么知道電腦安裝了監(jiān)視軟件沒有) 遠(yuǎn)征ol完整客戶端下載(遠(yuǎn)征OL怎么獲得夜照玉獅子 寫明具體方法) 家庭怎樣防盜?(家庭如何防盜) 英語單詞apply用法 re瀏覽器官網(wǎng)(re瀏覽器) wps文字如何刪除頁眉橫線(wpsword怎么刪除頁眉橫線) 額濟納旗旅游住宿攻略(額濟納旗旅行攻略) 物候的意思解釋(物候的意思) 新手如何開烘焙店?(新手如何開烘焙店賺錢) 巧克力用英語怎么說(巧克力用英語怎么說讀音) 淘寶顏色分類怎么設(shè)置成圖片(淘寶顏色分類怎么設(shè)置) 找不到d3d8.dll d3d8thk.dll丟失 解決方案(d3dx9_27.dll丟失怎么辦) 過敏性鼻炎怎么治 過敏性鼻炎治療方法分享(你搜索一下過敏性鼻炎該怎么治療) bmi指數(shù)計算器(bmi指數(shù)) 9款圓臉女生適合的甜美長卷發(fā)發(fā)型(9款圓臉女生適合的甜美長卷發(fā)發(fā)型是什么) 測排卵期怎么測(測排卵期) 進口奶粉哪個好 教你選購進口奶粉(進口奶粉和進口牛奶哪個好) 組織機構(gòu)怎么寫模板(組織機構(gòu)怎么寫) 怎么換微信主題皮膚(怎么換微信主題皮膚華為) 安裝GHOST系統(tǒng)后 IE主頁被鎖修改不了怎么辦 李瑞東太極十三樁(李瑞東) 花字拼音怎么拼寫(花字拼音怎么拼寫視頻) S8韓服高勝率虛空先知瑪爾扎哈上單符文天賦出裝(新版本瑪爾扎哈出裝) 后綴是什么意思中文(后綴是什么意思) 土豆怎么放才不發(fā)芽(土豆怎么放才不發(fā)芽不腐爛呢) 動圈話筒和電容話筒的區(qū)別(動圈話筒和電容話筒的區(qū)別在哪) 酒店前臺常用英語(酒店前臺英語常用語) dnf95深淵怎么刷(地下城95怎么刷深淵) 英雄聯(lián)盟諾提勒斯技能被動介紹(諾提勒斯技能加點) 什么叫中性點接地系統(tǒng)(什么叫中性點) 蛙泳手腳配合慢鏡頭(蛙泳手腳配合慢動作) 怎樣安裝電腦xp系統(tǒng)
您的位置:首頁 >行業(yè)動態(tài) >

新的人工智能將自然語言處理的力量帶到非洲語言中

導(dǎo)讀 研究人員開發(fā)了一種人工智能模型,以幫助計算機更有效地使用更廣泛的語言。非洲語言很少受到計算機科學(xué)家的關(guān)注,因此非洲的大片地區(qū)幾乎沒

研究人員開發(fā)了一種人工智能模型,以幫助計算機更有效地使用更廣泛的語言。

非洲語言很少受到計算機科學(xué)家的關(guān)注,因此非洲的大片地區(qū)幾乎沒有自然語言處理能力?;F盧大學(xué) David R. Cheriton 計算機科學(xué)學(xué)院的研究人員開發(fā)的新語言模型開始填補這一空白,使計算機能夠分析非洲語言文本以執(zhí)行許多有用的任務(wù)。

研究人員稱之為 AfriBERTa 的新神經(jīng)網(wǎng)絡(luò)模型使用深度學(xué)習(xí)技術(shù)為低資源語言實現(xiàn)了最先進的結(jié)果。

該神經(jīng)語言模型專門用于 11 種非洲語言,例如阿姆哈拉語、豪薩語和斯瓦希里語,這些語言的總?cè)藬?shù)超過 4 億。盡管僅從 1 GB 的文本中學(xué)習(xí),但它實現(xiàn)了與現(xiàn)有最??佳模型相媲美的輸出質(zhì)量,而其他模型需要數(shù)千倍的數(shù)據(jù)。

滑鐵盧大學(xué)計算機科學(xué)碩士生 Kelechi Ogueji 說:“預(yù)訓(xùn)練的語言模型已經(jīng)改變了計算機處理和分析從機器翻譯到問答等任務(wù)的文本數(shù)據(jù)的方式。”“可悲的是,非洲語言幾乎沒有受到研究界的關(guān)注。”

“其中一個挑戰(zhàn)是神經(jīng)網(wǎng)絡(luò)的構(gòu)建需要大量的文本和計算機。與擁有大量可用文本的英語不同,全世界使用的大約 7,000 種語言中的大多數(shù)都可以歸為資源匱乏的特征,因為缺乏可用的數(shù)據(jù)來饋送數(shù)據(jù)饑渴的神經(jīng)網(wǎng)絡(luò)。”

大多數(shù)這些模型使用稱為預(yù)訓(xùn)練的技術(shù)工作。為了實現(xiàn)這一點,研究人員向模型展示了一些文字被掩蓋或掩蓋的文本。然后模型必須猜測被屏蔽的詞。通過重復(fù)這個過程數(shù)十億次,該模型學(xué)習(xí)了單詞之間的統(tǒng)計關(guān)聯(lián),這模仿了人類的語言知識。

“能夠?qū)δ承┫掠稳蝿?wù)同樣準(zhǔn)確的模型進行預(yù)訓(xùn)練,但使用極少的數(shù)據(jù)有很多優(yōu)勢,”計算機科學(xué) Cheriton 主席兼 Ogueji 的顧問 Jimmy Lin 說。“需要更少的數(shù)據(jù)來訓(xùn)練語言模型意味著需要更少的計算,從而降低與運營海量數(shù)據(jù)中心相關(guān)的碳排放。較小的數(shù)據(jù)集也使數(shù)據(jù)管理更實用,這是減少模型中存在的偏差的一種方法。”

標(biāo)簽:

免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!

最新文章