亚洲网中文字幕_亚洲开心激情在线_欧美日韩中文精品在线_日本乱中文字幕在线系列

DeepSeek崛起 AI經(jīng)濟(jì)模型或?qū)㈤_啟全面重構(gòu)
來源:21世紀(jì)經(jīng)濟(jì)報(bào)道作者:趙云帆2025-01-15 09:54

就在DeepSeek(深度求索)發(fā)布V3幾天前,OpenAI首席執(zhí)行官薩姆·奧特曼在一場采訪中,談到了中美在AI領(lǐng)域的競爭。

一方面,奧特曼屢屢強(qiáng)調(diào)OpenAI在AI領(lǐng)域的主導(dǎo)性和領(lǐng)先性,同時(shí)呼吁在美國完全本土化AI產(chǎn)業(yè)鏈,包括生產(chǎn)芯片、建設(shè)足夠多的能源,改變數(shù)據(jù)中心建設(shè)模式,建立非常昂貴且復(fù)雜的供應(yīng)鏈和基礎(chǔ)設(shè)施等。

但另一方面,奧特曼卻又話風(fēng)一轉(zhuǎn),聲稱美國應(yīng)該在AI領(lǐng)域與中國緊密合作。而這一言論,對(duì)于封禁中國大陸IP最為激進(jìn)的OpenAI來說,極具諷刺意味。

曾經(jīng)宛若AI領(lǐng)域的大神,如今的OpenAI卻因?yàn)槟P驮絹碓介]塞,而被科技圈戲謔為“CloseAI(關(guān)閉AI)”。

幾天之后,來自中國的DeepSeek V3如石破天驚一般問世。在高端芯片禁運(yùn)的情況下,DeepSeek V3靠著往年囤積的“閹割版”H卡,用區(qū)區(qū)五百萬美元,在驚人的不到三百萬GPU小時(shí)里完成了預(yù)訓(xùn)練,獲得了聊天機(jī)器人競技場(Chatbot Arena)隨機(jī)基準(zhǔn)(Benchmark)測試第七、開源模型排名第一的成績。

高效訓(xùn)練帶來的結(jié)果是,DeepSeek-V3幾乎有著媲美Claude 3.5 Sonnet的數(shù)學(xué)和編程能力,卻能提供后者五十三分之一的使用價(jià)格。

幾乎在同時(shí),AI輿論天平開始搖擺——海外互聯(lián)網(wǎng)上,GPT5研發(fā)遭遇瓶頸的質(zhì)疑再度被提及,人們驚嘆“對(duì)中國芯片禁運(yùn)無意義”。

“AI賣鏟人”英偉達(dá)的股價(jià)也在2025年出現(xiàn)了劇烈的下跌,冥冥之中似乎與DeepSeek-V3的出現(xiàn)有關(guān)。

一時(shí)間,整個(gè)AI產(chǎn)業(yè)的經(jīng)濟(jì)模型,都在DeepSeek-V3的出現(xiàn)后,悄然動(dòng)搖。

神秘力量崛起

不知從何時(shí)開始,AI界開始用“萬卡集群”來描述步入大模型的門檻——DeepSeek-V3出現(xiàn)前,聊天機(jī)器人競技場頭部模型企業(yè)掌握的GPU集群清一色在五位數(shù)以上,萬卡就像是AI梭哈局里的“驗(yàn)資證明”。

隨后便是DeepSeek-V3的出現(xiàn),AI在當(dāng)前的發(fā)展模型中,突然長出了一個(gè)不符合發(fā)展規(guī)律的“奇點(diǎn)”。

所有人都試圖理解,為什么它的預(yù)訓(xùn)練那么快,應(yīng)用接口價(jià)格那么地便宜。許多人都提到了MLA、MoE、FP8三大創(chuàng)新。

然而,除了MLA為DeepSeek公司在V2時(shí)期拋出的原創(chuàng)概念,MoE、FP8等技術(shù)都并非原生。

比如MoE(集成本地專家)架構(gòu)——形象的說法是他將全人類的問題進(jìn)行分類,通過分類來降低每個(gè)問題需要激活的參數(shù)。MoE的概念最早誕生在1991年,但到2023年才由Mistral AI最先采用。之后,它幾乎成為了所有新版大模型的標(biāo)配工程,每家的MoE架構(gòu)都有自己的特色。

FP8更是英偉達(dá)早在2022年發(fā)布H卡時(shí)就預(yù)言過的浮點(diǎn)格式,其理論極限倍速是傳統(tǒng)FP16的兩倍。但具體能提高多少?其實(shí)很難,至少在DeepSeek之前,很少有大模型團(tuán)隊(duì)熱衷于通過FP8突破算力瓶頸。

僅從結(jié)果來看,DeepSeek的大部分創(chuàng)新都建立在其他先驅(qū)的基礎(chǔ)之上,但對(duì)創(chuàng)新工程技術(shù)應(yīng)用所達(dá)到的程度,卻依然令人匪夷所思。

因此業(yè)內(nèi)人都有一個(gè)共識(shí),DeepSeek強(qiáng)大,來源于其神秘工程團(tuán)隊(duì)。

“他們是一只非常精銳的中國團(tuán)隊(duì)——就他們構(gòu)建強(qiáng)大語言的能力而言,我會(huì)把他們放在Mistral和OpenAI/DeepMind團(tuán)隊(duì)中間位置?!鼻癉eepMind工程師,知名科技博主Aleksa Gordic(亞歷克薩·戈迪奇)在社交媒體上驚嘆。

AI新格局重構(gòu)

《三體:黑暗森林》中有這樣一個(gè)認(rèn)知,科技的發(fā)展并不是階梯式的,技術(shù)爆發(fā)往往以不期而至的方式到來。

在AI這個(gè)領(lǐng)域,技術(shù)爆炸的時(shí)間節(jié)點(diǎn)也非常難以預(yù)測。

在DeepSeek-V3發(fā)布前,上一個(gè)在業(yè)界公認(rèn)取得如此多創(chuàng)新的,還是2024年12月Meta發(fā)布的Llama3.1 405B。

而再上一個(gè)突破大概發(fā)生在2024年6月份,Anthropic公司推出編程專長大模型?Claude 3.5 Sonnet,再往前就是當(dāng)年5月份OpenAI推出的ChatGPT4.0。

即便對(duì)于中國大模型而言,上一輪出圈的Kimi,與DeepSeek-V3發(fā)布也才隔了不到一年。

與算力、工程能力同步迭代的海外大模型企業(yè)不同,DeepSeek受制于芯片禁運(yùn)的束縛,以兩個(gè)數(shù)量級(jí)的成本優(yōu)勢,宣告著工程能力的巨大差異,甚至可能導(dǎo)致現(xiàn)有AI經(jīng)濟(jì)模型完全重構(gòu)……

就在DeepSeek-V3發(fā)布后不久,有人在使用中發(fā)現(xiàn)DeepSeek-V3在一次問答中把自己稱為“ChatGPT”。

這個(gè)被稱之為“自我認(rèn)知錯(cuò)誤”的“BUG”,其實(shí)普遍發(fā)生在許多大模型的推理結(jié)果中,顯示著當(dāng)今時(shí)代數(shù)據(jù)污染的普遍存在,以及大模型之間互相借鑒越來越頻繁。

而不管是開源的DeepSeek,還是閉源的OpenAI,AI數(shù)據(jù)與工程技術(shù)的互相借鑒,幾乎是不可能被封鎖的。

有些魔幻現(xiàn)實(shí)的是,由于DeepSeek-V3完全地開源,在可以預(yù)見的,甚至幾乎確定不會(huì)太久的未來,DeepSeek-V3的巨大優(yōu)勢,必然會(huì)被后來的效仿者、創(chuàng)新者所抹平,超越。

但既然選擇了開源,就代表了DeepSeek完全接受這一點(diǎn),并認(rèn)為自己還能做出更好的。

2023年,DeepSeek實(shí)際控制人梁文鋒在接受采訪時(shí)也表達(dá)了類似觀點(diǎn):

“無論大廠,還是創(chuàng)業(yè)公司,都很難在短時(shí)間內(nèi)建立起碾壓對(duì)手的技術(shù)優(yōu)勢。因?yàn)橛蠴penAI指路,又都基于公開論文和代碼……從長期看,大模型應(yīng)用門檻會(huì)越來越低,初創(chuàng)公司在未來20年任何時(shí)候下場,也都有機(jī)會(huì)?!?/p>

創(chuàng)新驅(qū)動(dòng)力

既然AI企業(yè)無法通過閉源獲得優(yōu)勢,那么唯一值得信賴的便是團(tuán)隊(duì)本身了。

回顧梁文鋒的采訪,其大量的談話落在了團(tuán)隊(duì)建設(shè)上,鼓勵(lì)創(chuàng)新上。著眼能力,淡化履歷,看中好奇心驅(qū)動(dòng)。

“很多人會(huì)以為這里邊有一個(gè)不為人知的商業(yè)邏輯,但其實(shí),主要是好奇心驅(qū)動(dòng)?!绷何匿h在采訪中表示。

經(jīng)典的企業(yè)管理認(rèn)為,好的制度能讓企業(yè)自行運(yùn)轉(zhuǎn),不論崗位上是誰,都能像螺釘一樣各司其職。

而梁文鋒卻認(rèn)為,由幻方量化積累的資本和算力底蘊(yùn),可以讓DeepSeek暫時(shí)忘卻商業(yè)化,并保持企業(yè)純粹的創(chuàng)新文化。

寄托的AGI發(fā)展的人類大計(jì),最后仍要取決于微觀引領(lǐng)者的企業(yè)文化和團(tuán)隊(duì)建設(shè),這一巨大的反差背后,卻頗有返璞歸真的意味。

幾乎就在12月份之前,GPT5遲遲無法落地的消息,讓許多AI從業(yè)者存在這樣一個(gè)認(rèn)知:“AI工程能力似乎已經(jīng)接近了瓶頸。而面對(duì)越來越難清洗的數(shù)據(jù)和芯片、電力的制約,AGI已經(jīng)撞上了南墻。”

就像早在十九世紀(jì)就有人說,“物理學(xué)的大廈已經(jīng)完成了,后人只要做修繕裝飾的工作”。

但DeepSeek顯然打破了瓶頸認(rèn)知,并告訴我們,即便是從工程能力迭代的角度,AI能力的瓶頸,仍然遠(yuǎn)遠(yuǎn)沒有到來。

“我們希望更多人,哪怕一個(gè)小App都可以低成本去用上大模型,而不是技術(shù)只掌握在一部分人和公司手中,形成壟斷?!绷何匿h說道。

而若未來真如他所說,唯一能確定的是,算力將不再成為困擾AI時(shí)代的瓶頸。包括當(dāng)下“AI賣水人”經(jīng)濟(jì)模型,可能也會(huì)順勢完成重構(gòu)。

責(zé)任編輯: 陳勇洲
聲明:證券時(shí)報(bào)力求信息真實(shí)、準(zhǔn)確,文章提及內(nèi)容僅供參考,不構(gòu)成實(shí)質(zhì)性投資建議,據(jù)此操作風(fēng)險(xiǎn)自擔(dān)
下載“證券時(shí)報(bào)”官方APP,或關(guān)注官方微信公眾號(hào),即可隨時(shí)了解股市動(dòng)態(tài),洞察政策信息,把握財(cái)富機(jī)會(huì)。
網(wǎng)友評(píng)論
登錄后可以發(fā)言
發(fā)送
網(wǎng)友評(píng)論僅供其表達(dá)個(gè)人看法,并不表明證券時(shí)報(bào)立場
暫無評(píng)論
為你推薦
時(shí)報(bào)熱榜
換一換
    熱點(diǎn)視頻
    換一換