123,123,123

相信很多朋友還不知道斯坦?；貞?yīng)抄襲清華系大模型：承認(rèn)、道歉、刪除吧,今天小天就給大家說一說吧,現(xiàn)在讓我們一起來看看吧~.~！

5月29日，斯坦福一AI團(tuán)隊發(fā)布了一個名為Llama3-V的多模態(tài)大模型，宣稱只需500美元就可訓(xùn)練出一個性能可與GPT4-V媲美的模型。但隨后，該團(tuán)隊發(fā)布的模型被指抄襲，其與國內(nèi)清華系大模型相似度極高。面壁智能CEO李大海和聯(lián)合創(chuàng)始人劉知遠(yuǎn)先后發(fā)文回應(yīng)，表示這是一種受到國際團(tuán)隊認(rèn)可的方式，但希望大家共建開放、合作、有信任的社區(qū)環(huán)境。目前，該團(tuán)隊已公開道歉，并刪除了相關(guān)庫和官宣推文。

斯坦福AI團(tuán)隊抄襲，成員公開道歉

斯坦福大學(xué)AI團(tuán)隊在2024年5月29日發(fā)布了一個名為Llama3-V的多模態(tài)大模型，聲稱只需500美元就能訓(xùn)練出一個性能可與GPT4-V媲美的模型。Llama3-V不僅在社交媒體上迅速躥紅，還一度沖上了HuggingFace趨勢榜首頁。

圖片來源：X

然而，一名細(xì)心且熱心的網(wǎng)友發(fā)現(xiàn)，該團(tuán)隊發(fā)布的Llama3-V和國內(nèi)大模型MiniCPM-Llama3-V 2.5有極高的相似度，后者是由國內(nèi)大模型初創(chuàng)企業(yè)“面壁智能”和清華大學(xué)自然語言處理實驗室聯(lián)合推出的。

網(wǎng)友還在在面壁智能GitHub的項目下放出了一系列證據(jù)。

該網(wǎng)友表示，這兩個模型的結(jié)構(gòu)、代碼、配置文件都一模一樣，只有變量名被替換了。

兩個模型的代碼對比圖片來源：GitHub

隨后，面壁智能首席科學(xué)家、清華大學(xué)長聘副教授劉知遠(yuǎn)在知乎上回應(yīng)，MiniCPM-Llama3-V 2.5在研發(fā)時內(nèi)置了一個彩蛋，就是對“清華簡”的識別能力，而Llama3-V模型居然也有一模一樣的能力。

清華簡是清華大學(xué)于2008年7月收藏的一批戰(zhàn)國竹簡，為戰(zhàn)國中晚期文物。劉知遠(yuǎn)透露，識別清華簡是MiniCPM-Llama3-V 2.5的一項實驗功能，訓(xùn)練圖像是最近從出土文物中掃描并標(biāo)注，且尚未公開發(fā)布。

關(guān)鍵性證據(jù)這不就來了！

圖片來源：知乎

而兩個模型在識別的表現(xiàn)上，正確的結(jié)果上基本一致，錯誤的情況也頗為相似。

遭到大量質(zhì)疑后，該斯坦福團(tuán)隊成員已刪除他們在X上官宣模型的推文，并將該項目在Github和HuggingFace上的庫一并刪除。

圖片來源：X

最新消息，4日，斯坦福Llama3-V團(tuán)隊的兩位作者森德哈斯·沙瑪（Siddharth Sharma）和阿克沙·加格（Aksh Garg）在社交平臺上就這一學(xué)術(shù)不端行為向面壁MiniCPM團(tuán)隊正式道歉，并表示會將Llama3-V模型悉數(shù)撤下。

阿克沙表示，“首先，我們要向MiniCPM原作者道歉。我、森德哈斯·沙瑪，以及穆斯塔法（Mustafa）一起發(fā)布了Llama3-V，穆斯塔法為這個項目編寫了代碼，但從昨天起就無法聯(lián)系他。我與森德哈斯·沙瑪主要負(fù)責(zé)幫助穆斯塔法進(jìn)行模型推廣。我們倆查看了最新的論文，以驗證這項工作的新穎性，但并未被告知或意識到OpenBMB（清華團(tuán)隊支持發(fā)起的大規(guī)模預(yù)訓(xùn)練語言模型庫與相關(guān)工具）之前的任何工作。我們向作者道歉，并對自己沒有努力驗證這項工作的原創(chuàng)性感到失望。我們對所發(fā)生的事情承擔(dān)全部責(zé)任，并已撤下Llama3-V，再次致歉?！?/p>

此外，斯坦福人工智能實驗室主任克里斯托弗·大衛(wèi)·曼寧（Christopher David Manning）也發(fā)文譴責(zé)這一抄襲行為。

圖片來源：X

面壁智能回應(yīng)：“技術(shù)創(chuàng)新不易”“深表遺憾”

據(jù)第一財經(jīng)報道，6月3日，面壁智能CEO李大海及其聯(lián)合創(chuàng)始人劉知遠(yuǎn)相繼公開發(fā)聲，就他們公司的開源模型被斯坦福大學(xué)AI團(tuán)隊疑似抄襲的問題作出了回應(yīng)。

李大海在聲明中表達(dá)了對此事的深切遺憾，并指出，盡管從某種程度上看，這種模仿可以被視為他們的成果得到了國際團(tuán)隊的某種認(rèn)可，但他更強(qiáng)調(diào)應(yīng)該構(gòu)建一個開放、協(xié)作且充滿信任的技術(shù)社區(qū)環(huán)境。他進(jìn)一步強(qiáng)調(diào)，他們希望團(tuán)隊的努力和優(yōu)秀工作能夠吸引更多人的關(guān)注和認(rèn)可，但并非以這種被模仿甚至抄襲的方式。

圖片來源：第一財經(jīng)

面壁智能首席科學(xué)家、清華大學(xué)長聘副教授劉知遠(yuǎn)也表示，人工智能的飛速發(fā)展離不開全球算法、數(shù)據(jù)與模型的開源共享，讓人們始終可以站在SOTA的肩上持續(xù)前進(jìn)。面壁開源的MiniCPM-Llama3-V 2.5就用了最新的Llama3作為語言模型基座。而開源共享的基石是對開源協(xié)議的遵守，對其他貢獻(xiàn)者的信任，對前人成果的尊重和致敬，Llama3-V團(tuán)隊無疑嚴(yán)重破壞了這一點。他們在受到質(zhì)疑后已在Huggingface刪庫，該團(tuán)隊三人中的兩位也只是斯坦福大學(xué)本科生，未來還有很長的路，如果知錯能改，善莫大焉。

天眼查APP顯示，北京面壁智能科技有限責(zé)任公司成立于2022年8月，法定代表人為曾國洋，董事長為李大海，注冊資本約52.46萬人民幣，經(jīng)營范圍包括軟件開發(fā)、人工智能基礎(chǔ)軟件開發(fā)、人工智能理論與算法軟件開發(fā)、信息系統(tǒng)集成服務(wù)等。股東信息顯示，該公司由北京清語啟航科技中心（有限合伙）、曾國洋、李大海等共同持股。知識產(chǎn)權(quán)信息顯示，該公司已申請了多項專利，如“基于人工智能自適應(yīng)的NLP大模型分析系統(tǒng)”“深度學(xué)習(xí)模型統(tǒng)一應(yīng)用方法、裝置、服務(wù)器及存儲介質(zhì)”“基于人工智能的對話預(yù)測方法、裝置及存儲介質(zhì)”，當(dāng)前部分專利已獲授權(quán)。此外，該公司還登記了“CPM模型能力展示平臺”“面壁智能模力表格文本生成系統(tǒng)”等多個軟件著作權(quán)。

面壁智能目前已完成兩輪融資。去年4月，公司完成由知乎、智譜AI投資的數(shù)千萬人民幣天使輪融資；今年4月，公司宣布完成新一輪數(shù)億元融資，由春華創(chuàng)投、華為哈勃領(lǐng)投，北京市人工智能產(chǎn)業(yè)投資基金等跟投，知乎作為戰(zhàn)略股東持續(xù)跟投支持。

據(jù)其官網(wǎng)顯示，面壁智能聯(lián)合創(chuàng)始人、CEO李大海，碩士畢業(yè)于北京大學(xué)數(shù)學(xué)系，畢業(yè)后加入Google，成為Google中國創(chuàng)始員工之一，后在云云網(wǎng)任工程總監(jiān)，在豌豆莢任搜索技術(shù)負(fù)責(zé)人，連續(xù)12年創(chuàng)業(yè)經(jīng)驗。2015年加入知乎，任知乎合伙人、CTO。

面壁智能聯(lián)合創(chuàng)始人、首席科學(xué)家劉知遠(yuǎn)，是清華大學(xué)計算機(jī)系長聘副教授，智源青年科學(xué)家。主要研究方向為自然語言處理、知識圖譜和社會計算。在人工智能領(lǐng)域著名國際期刊和會議發(fā)表相關(guān)論文200余篇，Google Scholar統(tǒng)計引用超過3.1萬次。曾獲教育部自然科學(xué)一等獎、中國中文信息學(xué)會錢偉長中文信息處理科學(xué)技術(shù)獎一等獎、入選國家青年人才計劃、《麻省理工科技評論》中國區(qū)35歲以下科技創(chuàng)新35人榜單。

圖片來源：面壁智能官網(wǎng)

每日經(jīng)濟(jì)新聞綜合第一財經(jīng)、公開消息

以上就是關(guān)于【斯坦福回應(yīng)抄襲清華系大模型：承認(rèn)、道歉、刪除】的相關(guān)內(nèi)容，希望對您有幫助！

標(biāo)簽：斯坦福回應(yīng)抄襲清華系大模型：承認(rèn)、道歉、刪除

免責(zé)聲明：本文由用戶上傳，與本網(wǎng)站立場無關(guān)。財經(jīng)信息僅供讀者參考，并不構(gòu)成投資建議。投資者據(jù)此操作，風(fēng)險自擔(dān)。如有侵權(quán)請聯(lián)系刪除！

斯坦?；貞?yīng)抄襲清華系大模型：承認(rèn)、道歉、刪除

猜你喜歡

最新文章