">
工聯(lián)網(wǎng)消息(IItime) 9月17日深夜,今年1月引發(fā)全球轟動(dòng)的開(kāi)源AI大模型DeepSeek-R1,在經(jīng)過(guò)8個(gè)多月嚴(yán)格的同行評(píng)審之后,登上國(guó)際頂尖學(xué)術(shù)期刊《自然》雜志封面,成為全球首個(gè)經(jīng)過(guò)同行評(píng)審的大語(yǔ)言模型。
此前,主流大模型通常采用一套不同于學(xué)術(shù)界的成果發(fā)布方式:開(kāi)直播,在預(yù)印本網(wǎng)站和官方技術(shù)博客上發(fā)布突破性成果,同時(shí)在測(cè)評(píng)榜上拿下高分,以證明各自的技術(shù)優(yōu)勢(shì)。年初,DeepSeek-R1的業(yè)界影響力也是由此而來(lái)。
近年來(lái),人工智能,特別是大語(yǔ)言模型,正以驚人的速度和一種近乎“黑箱”的方式發(fā)展。此次,DeepSeek團(tuán)隊(duì)在《自然》雜志上發(fā)表論文,無(wú)疑打破了行業(yè)慣例。對(duì)此,多位專(zhuān)家表示,此舉意味著“野蠻生長(zhǎng)”的大模型正在向更為透明、可復(fù)現(xiàn)的方向發(fā)展,同時(shí)也意味著人工智能正努力融入更廣泛的科學(xué)社區(qū),為AI與其他領(lǐng)域的融合打通更多壁壘。
影響力倒掛?發(fā)表生態(tài)在改變
這篇由梁文鋒擔(dān)任通訊作者的論文披露了DeepSeek-R1更多訓(xùn)練細(xì)節(jié),包括29.4萬(wàn)美元的超低訓(xùn)練成本,并正面回應(yīng)了模型發(fā)布之初的蒸餾質(zhì)疑。
實(shí)際上,這篇關(guān)于DeepSeek-R1的論文早今年1月就以預(yù)印本形式發(fā)表在arXiv平臺(tái)上。此次論文正式發(fā)表前,經(jīng)歷了8名同行評(píng)審,并在他們的反饋下作了許多修改、完善和補(bǔ)充,論文的清晰度、可信度和完整度得到進(jìn)一步提升。
自今年1月在全球最大開(kāi)源AI社區(qū)Hugging Face發(fā)布以來(lái),DeepSeek-R1模型已成為該平臺(tái)上下載量最高的復(fù)雜問(wèn)題解決類(lèi)模型。截至9月18日,R1模型的預(yù)印本論文也在短短8個(gè)多月中,獲得約3600次引用——在大模型領(lǐng)域,這是一個(gè)很高的引用數(shù)據(jù)。
“DeepSeek-R1用無(wú)限強(qiáng)化學(xué)習(xí)、獎(jiǎng)懲制度來(lái)提升大模型的推理能力,在業(yè)界起到了引領(lǐng)風(fēng)潮的作用。”在浙江大學(xué)本科生院院長(zhǎng)、人工智能研究所所長(zhǎng)吳飛教授看來(lái),盡管8個(gè)月的同行評(píng)審使論文更趨完善,但其最具創(chuàng)新性的方法并沒(méi)有實(shí)質(zhì)改變。
吳飛注意到,這8個(gè)月間,在某些任務(wù)表現(xiàn)上,有些大模型已超越DeepSeek-R1,但《自然》并未選擇發(fā)表那些成果,反而堅(jiān)持發(fā)表這篇已在預(yù)印本平臺(tái)上發(fā)表過(guò)的論文,“這是前所未見(jiàn)的”。
過(guò)去,AlphaGo、AlphaFold等論文登上《自然》都是首發(fā),而這篇首秀在arXiv上的論文不僅登上頂刊《自然》封面,編輯部還為此配發(fā)社論,這讓吳飛感覺(jué)到AI正在改變論文發(fā)表生態(tài)——或許未來(lái)全球影響力最高的20篇論文,可能最早發(fā)表于草根平臺(tái)。
AI需要加入更大“科學(xué)群聊”
在眾多業(yè)內(nèi)人士看來(lái),這次R1模型登上《自然》,除了肯定其學(xué)術(shù)價(jià)值,還標(biāo)志著AI基礎(chǔ)模型正從一個(gè)靠技術(shù)博客和“打榜”為主要評(píng)價(jià)標(biāo)準(zhǔn)的領(lǐng)域,邁向以方法論的科學(xué)性、可復(fù)現(xiàn)性和嚴(yán)謹(jǐn)驗(yàn)證為核心的成熟科學(xué)。
上海科技大學(xué)信息學(xué)院助理院長(zhǎng)屠可偉教授告訴記者,期刊發(fā)表周期至少6-12個(gè)月,會(huì)議論文則需3-6個(gè)月,這樣的發(fā)表速度對(duì)AI來(lái)說(shuō)太慢了。不過(guò),在“誰(shuí)都能往上發(fā)”的預(yù)印本平臺(tái)arXiv上,論文質(zhì)量也的確良莠不齊。屠可偉認(rèn)為,R1模型通過(guò)同行評(píng)審登上《自然》,更大的意義在于,讓AI獲得了更廣泛科學(xué)群體的關(guān)注。
《自然》雜志在同步發(fā)表的社論中表示,當(dāng)前,那些正迅速改變?nèi)祟?lèi)知識(shí)獲取方式的主流大語(yǔ)言模型中,尚無(wú)任何一個(gè)經(jīng)過(guò)研究期刊的獨(dú)立同行評(píng)審。嚴(yán)格的同行評(píng)審有助于清晰呈現(xiàn)大型語(yǔ)言模型的工作原理,并幫助評(píng)估其是否能實(shí)現(xiàn)宣稱(chēng)的功能,有利于遏制人工智能行業(yè)的炒作現(xiàn)象。此次DeepSeek-R1打破行業(yè)慣例,讓大模型朝著提升透明度的方向邁出了可喜一步。
同時(shí),同行評(píng)審還能增強(qiáng)研究的可信度,在不同群體中獲得更高認(rèn)可度。此外,評(píng)審還會(huì)對(duì)模型的安全性、防護(hù)機(jī)制作出要求,將推動(dòng)改善目前頗受關(guān)注的數(shù)據(jù)污染、固有偏見(jiàn)等問(wèn)題。
屠可偉坦言,人工智能需要在更大范圍與其他學(xué)科領(lǐng)域加速融合,而實(shí)踐中面臨的最大挑戰(zhàn)就是學(xué)科隔閡,增進(jìn)科學(xué)家與AI專(zhuān)家之間的交流極為必要。“此次R1模型登上《自然》,有助于讓AI融入更大的‘科學(xué)群聊’。”