相信很多朋友還不知道斯坦?;貞u清華系大模型:承認、道歉、刪除吧,今天小天就給大家說一說吧,現在讓我們一起來看看吧~.~!
5月29日,斯坦福一AI團隊發(fā)布了一個名為Llama3-V的多模態(tài)大模型,宣稱只需500美元就可訓練出一個性能可與GPT4-V媲美的模型。但隨后,該團隊發(fā)布的模型被指抄襲,其與國內清華系大模型相似度極高。面壁智能CEO李大海和聯合創(chuàng)始人劉知遠先后發(fā)文回應,表示這是一種受到國際團隊認可的方式,但希望大家共建開放、合作、有信任的社區(qū)環(huán)境。目前,該團隊已公開道歉,并刪除了相關庫和官宣推文。
斯坦福AI團隊抄襲,成員公開道歉
斯坦福大學AI團隊在2024年5月29日發(fā)布了一個名為Llama3-V的多模態(tài)大模型,聲稱只需500美元就能訓練出一個性能可與GPT4-V媲美的模型。Llama3-V不僅在社交媒體上迅速躥紅,還一度沖上了HuggingFace趨勢榜首頁。
圖片來源:X
然而,一名細心且熱心的網友發(fā)現,該團隊發(fā)布的Llama3-V和國內大模型MiniCPM-Llama3-V 2.5有極高的相似度,后者是由國內大模型初創(chuàng)企業(yè)“面壁智能”和清華大學自然語言處理實驗室聯合推出的。
網友還在在面壁智能GitHub的項目下放出了一系列證據。
該網友表示,這兩個模型的結構、代碼、配置文件都一模一樣,只有變量名被替換了。
兩個模型的代碼對比圖片來源:GitHub
隨后,面壁智能首席科學家、清華大學長聘副教授劉知遠在知乎上回應,MiniCPM-Llama3-V 2.5在研發(fā)時內置了一個彩蛋,就是對“清華簡”的識別能力,而Llama3-V模型居然也有一模一樣的能力。
清華簡是清華大學于2008年7月收藏的一批戰(zhàn)國竹簡,為戰(zhàn)國中晚期文物。劉知遠透露,識別清華簡是MiniCPM-Llama3-V 2.5的一項實驗功能,訓練圖像是最近從出土文物中掃描并標注,且尚未公開發(fā)布。
關鍵性證據這不就來了!
圖片來源:知乎
而兩個模型在識別的表現上,正確的結果上基本一致,錯誤的情況也頗為相似。
遭到大量質疑后,該斯坦福團隊成員已刪除他們在X上官宣模型的推文,并將該項目在Github和HuggingFace上的庫一并刪除。
圖片來源:X
最新消息,4日,斯坦福Llama3-V團隊的兩位作者森德哈斯·沙瑪(Siddharth Sharma)和阿克沙·加格(Aksh Garg)在社交平臺上就這一學術不端行為向面壁MiniCPM團隊正式道歉,并表示會將Llama3-V模型悉數撤下。
阿克沙表示,“首先,我們要向MiniCPM原作者道歉。我、森德哈斯·沙瑪,以及穆斯塔法(Mustafa)一起發(fā)布了Llama3-V,穆斯塔法為這個項目編寫了代碼,但從昨天起就無法聯系他。我與森德哈斯·沙瑪主要負責幫助穆斯塔法進行模型推廣。我們倆查看了最新的論文,以驗證這項工作的新穎性,但并未被告知或意識到OpenBMB(清華團隊支持發(fā)起的大規(guī)模預訓練語言模型庫與相關工具)之前的任何工作。我們向作者道歉,并對自己沒有努力驗證這項工作的原創(chuàng)性感到失望。我們對所發(fā)生的事情承擔全部責任,并已撤下Llama3-V,再次致歉。”
此外,斯坦福人工智能實驗室主任克里斯托弗·大衛(wèi)·曼寧(Christopher David Manning)也發(fā)文譴責這一抄襲行為。
圖片來源:X
面壁智能回應:“技術創(chuàng)新不易”“深表遺憾”
據第一財經報道,6月3日,面壁智能CEO李大海及其聯合創(chuàng)始人劉知遠相繼公開發(fā)聲,就他們公司的開源模型被斯坦福大學AI團隊疑似抄襲的問題作出了回應。
李大海在聲明中表達了對此事的深切遺憾,并指出,盡管從某種程度上看,這種模仿可以被視為他們的成果得到了國際團隊的某種認可,但他更強調應該構建一個開放、協作且充滿信任的技術社區(qū)環(huán)境。他進一步強調,他們希望團隊的努力和優(yōu)秀工作能夠吸引更多人的關注和認可,但并非以這種被模仿甚至抄襲的方式。
圖片來源:第一財經
面壁智能首席科學家、清華大學長聘副教授劉知遠也表示,人工智能的飛速發(fā)展離不開全球算法、數據與模型的開源共享,讓人們始終可以站在SOTA的肩上持續(xù)前進。面壁開源的MiniCPM-Llama3-V 2.5就用了最新的Llama3作為語言模型基座。而開源共享的基石是對開源協議的遵守,對其他貢獻者的信任,對前人成果的尊重和致敬,Llama3-V團隊無疑嚴重破壞了這一點。他們在受到質疑后已在Huggingface刪庫,該團隊三人中的兩位也只是斯坦福大學本科生,未來還有很長的路,如果知錯能改,善莫大焉。
天眼查APP顯示,北京面壁智能科技有限責任公司成立于2022年8月,法定代表人為曾國洋,董事長為李大海,注冊資本約52.46萬人民幣,經營范圍包括軟件開發(fā)、人工智能基礎軟件開發(fā)、人工智能理論與算法軟件開發(fā)、信息系統集成服務等。股東信息顯示,該公司由北京清語啟航科技中心(有限合伙)、曾國洋、李大海等共同持股。知識產權信息顯示,該公司已申請了多項專利,如“基于人工智能自適應的NLP大模型分析系統”“深度學習模型統一應用方法、裝置、服務器及存儲介質”“基于人工智能的對話預測方法、裝置及存儲介質”,當前部分專利已獲授權。此外,該公司還登記了“CPM模型能力展示平臺”“面壁智能模力表格文本生成系統”等多個軟件著作權。
面壁智能目前已完成兩輪融資。去年4月,公司完成由知乎、智譜AI投資的數千萬人民幣天使輪融資;今年4月,公司宣布完成新一輪數億元融資,由春華創(chuàng)投、華為哈勃領投,北京市人工智能產業(yè)投資基金等跟投,知乎作為戰(zhàn)略股東持續(xù)跟投支持。
據其官網顯示,面壁智能聯合創(chuàng)始人、CEO李大海,碩士畢業(yè)于北京大學數學系,畢業(yè)后加入Google,成為Google中國創(chuàng)始員工之一,后在云云網任工程總監(jiān),在豌豆莢任搜索技術負責人,連續(xù)12年創(chuàng)業(yè)經驗。2015年加入知乎,任知乎合伙人、CTO。
面壁智能聯合創(chuàng)始人、首席科學家劉知遠,是清華大學計算機系長聘副教授,智源青年科學家。主要研究方向為自然語言處理、知識圖譜和社會計算。在人工智能領域著名國際期刊和會議發(fā)表相關論文200余篇,Google Scholar統計引用超過3.1萬次。曾獲教育部自然科學一等獎、中國中文信息學會錢偉長中文信息處理科學技術獎一等獎、入選國家青年人才計劃、《麻省理工科技評論》中國區(qū)35歲以下科技創(chuàng)新35人榜單。
圖片來源:面壁智能官網
每日經濟新聞綜合第一財經、公開消息
以上就是關于【斯坦?;貞u清華系大模型:承認、道歉、刪除】的相關內容,希望對您有幫助!
免責聲明:本文由用戶上傳,如有侵權請聯系刪除!