從2024年12月發(fā)布V3大模型,到最近推出R1模型和多模態(tài)模型Janus-Pro,DeepSeek持續(xù)出圈,形成了全球AI界乃至整個科技圈的“DeepSeek現(xiàn)象”。
多次采訪馬斯克等AI企業(yè)家的知名播客主持人萊克斯·弗里德曼(Lex Fridman),用了一個詞叫做“DeepSeek時刻”來描述,“我認為5年后它仍將作為科技史上的關(guān)鍵事件被人們銘記?!?/p>
DeepSeek出圈的原因之一是,它采用“更聰明”的算法,把AI訓(xùn)練成本砍掉近60%,卻實現(xiàn)甚至超越了同類模型的性能。簡單來說,同樣的產(chǎn)品,別人花100塊訓(xùn)練一個AI模型,它只要40元。這種“省錢打法”直接戳中了行業(yè)的痛點——過去拼的是誰能買更多高價芯片,現(xiàn)在比的是誰能把芯片用得更好。
DeepSeek不僅提供了新的AI技術(shù)路線,更重要的是,它在硅谷和華爾街聯(lián)合主導(dǎo)的全球AI敘事鐵墻上撕開了一道口子。
但我們在自豪和興奮之余,還是要保持清醒的頭腦。且不說,在資金、技術(shù)、人才等方面,以DeepSeek為代表的新創(chuàng)AI企業(yè),尚無法向OpenAI、Anthropic這些巨頭發(fā)起全面挑戰(zhàn),單單就V3、R1而言,其算法優(yōu)化也有代價:處理復(fù)雜場景時,它的表現(xiàn)明顯不如燒錢堆出來的大模型。就像用精簡版PS軟件修圖——日常夠用,專業(yè)場景會露怯。何況,短時間內(nèi)我們還不足以撼動英偉達巨頭們的硬件江湖。
擺脫硬件依賴尚不現(xiàn)實
在“DeepSeek現(xiàn)象”推動下,未來的算力圖景,并非單一曲線繪就。
一方面,像DeepSeek這樣的產(chǎn)品,更低開發(fā)和消費成本、更高流量,可能帶來AI應(yīng)用的突然爆發(fā),這是所有從業(yè)人員夢寐以求的場景。
另一方面,當訓(xùn)練成本下降刺激更多公司入場,消費者應(yīng)用呈指數(shù)級增加,催生AI生態(tài)鏈全面繁榮,芯片需求將迎來超乎預(yù)期的增長。
硬幣兩面,恰好構(gòu)成了算力命題的悖論。
業(yè)內(nèi)人士援引騰訊之前發(fā)布的白皮書,AI Agent應(yīng)用要實現(xiàn)跳躍式增長乃至爆發(fā),必須闖過三關(guān):場景滲透率大于15%、任務(wù)完成度大于80%、用戶信任度大于60%。
僅以信任度為例,此前Gartner的一項抽樣調(diào)查顯示,64%的人表示,不希望在客戶服務(wù)中使用人工智能。
目前AI Agent應(yīng)用的技術(shù)能力僅滿足簡單場景,如客服、日程管理等。而復(fù)雜決策如醫(yī)療咨詢、法律建議等,仍存在難以填補的缺陷。AI最大的應(yīng)用場景是教育、醫(yī)療、金融等,但是,誤診率5%的AI醫(yī)生看病,依然很難被接受。就好比,無人駕駛比人類更安全,但無人駕駛每出現(xiàn)一次事故都會被凝視被放大。人類對AI的信任,只是處于初始水平,此外還面臨著各國隱私保護法規(guī)、用戶習(xí)慣、能源約束、技術(shù)路線分歧、多智能體協(xié)作、倫理困境等方面的挑戰(zhàn)。
業(yè)內(nèi)此前預(yù)計,要到2026年前后,才將出現(xiàn)AI信任度的分水嶺(大于60%)?!癉eepSeek現(xiàn)象”會不會加快這個時間表的到來?現(xiàn)在沒有人能夠斷定。
有人說,2025年將是AI Agent應(yīng)用元年。而DeepSeek通過異構(gòu)計算架構(gòu)、CPU+FPGA+ASIC混合部署和動態(tài)負載均衡算法等創(chuàng)新,將單位算力產(chǎn)出提升2倍多,這是否意味著它探索的技術(shù)方向?qū)⒋蚱扑懔艛?,?dǎo)致算力過剩?
這關(guān)系到算力現(xiàn)狀。其特點是嚴重不均衡。一是地區(qū)不均衡。北美尤其是美國占據(jù)了全球算力規(guī)模最大份額,其次是中國,但高性能算力基本集中在北美。同一經(jīng)濟體內(nèi)也存在區(qū)域不平衡。
二是供應(yīng)不均衡。GPU廠商主要是英偉達,2025年其GPU銷量預(yù)計可達700萬塊;CPU廠商主要是英特爾、AMD;BSIC芯片的主要廠商是博通和Marvell,合計占有超60%的份額;云計算方面,谷歌、微軟、亞馬遜占據(jù)全球65%的市場份額。這就是大家所說的算力壟斷。
三是企業(yè)不均衡。高端芯片方面,微軟、Meta、谷歌、亞馬遜、xAI幾大巨頭目前囤積的算力總共約合355萬塊等效H100,這還不包括AI新貴OpenAI在內(nèi)。其他經(jīng)濟體企業(yè)能拿到的高端芯片量,無法與之相比。
算力供需還存在結(jié)構(gòu)性錯配的問題。從縱向看,隨著多模態(tài)應(yīng)用的普及,推理側(cè)的算力需求增速已經(jīng)超過訓(xùn)練側(cè),但算力還主要布局于訓(xùn)練側(cè),調(diào)整需要一點時間;從橫向看,大量算力被消耗在數(shù)據(jù)清洗和模型調(diào)試等非核心環(huán)節(jié)。
以大模型算力為例。2024年下半年以來,大模型算力已經(jīng)從訓(xùn)練向推理轉(zhuǎn)移,其中占據(jù)推理算力市場最大份額的,仍然是英偉達。
《中國算力發(fā)展報告(2024)》援引IDC報告,截至2023年四季度,英偉達GPU全球市場份額達95.9%,英特爾和AMD在CPU市場合計占比89.2%。英偉達通過在CUDA和GPU兩端同時發(fā)力,構(gòu)筑了軟硬協(xié)同的護城河。有人說DeepSeek通過架構(gòu)革新,繞開了CUDA,沖破了它的護城河,這其實是誤讀。多位專家研讀DeepSeek公開(開源))論文后表示,V3、R1的底層架構(gòu)仍然是基于CUDA生態(tài)建構(gòu)。
在這種市場格局下,其他區(qū)域及其廠商要發(fā)起挑戰(zhàn),試圖打破巨頭壟斷,擺脫以英偉達為代表的算力依賴,更多是樂觀主義的展望式預(yù)期。除非量子芯片實現(xiàn)規(guī)?;逃?,但那是5年甚至10年以后的事。
至于算力過剩,短期內(nèi)不存在。《中國算力發(fā)展報告(2024)》援引中國信通院數(shù)據(jù),截至2023年底,全球算力規(guī)模同比增長40%,但以CPU為代表但芯片年性能提升不足15%,無法滿足視頻、圖片等非結(jié)構(gòu)化數(shù)據(jù)的處理需求。賽迪智庫2024年初測算,2023年中國智能算力需求達123.6EFLOPS,但智能算力供給規(guī)模僅為57.9EFLOPS,嚴重供不應(yīng)求?!癉eepSeek現(xiàn)象”目前看來是增加了而不是減少了硬件需求。比如,32G的英偉達RTX50系顯卡,近半個月漲勢兇猛,最高已經(jīng)炒到了6萬元以上。其中部分原因在于,不少消費者購入RTX50顯卡去做DeepSeek V3、R1本地化部署。
AI巨頭為何焦慮
既然DeepSeek尚未突破硬件限制,所做的也是巨人肩上的創(chuàng)新,但為什么還是引起美國AI巨頭的焦慮甚至恐慌?
從表層看,美國AI巨頭嗅到了危機,不是因為技術(shù)被超越,而是實現(xiàn)目標的技術(shù)路徑變了,新創(chuàng)企業(yè)有了更多選擇。就像燃油車時代比拼的是發(fā)動機,電動車時代比拼的是電池管理技術(shù)。DeepSeek證明了硅谷堆硬件堆數(shù)據(jù)的路線不是唯一選擇,高效用好現(xiàn)有資源同樣能打。
DeepSeek省錢省力的R1模型發(fā)布時,剛好是OpenAI、甲骨文、英偉達等科技巨頭宣布5000億美元算力基建——星際之門計劃的時間段,放在這個背景下對比來看,美國AI巨頭的刺痛感就更強烈了。
一位資深A(yù)I觀察人士告訴21世紀經(jīng)濟報道記者,DeepSeek發(fā)起的這場“效率革命”,是AI發(fā)展從技術(shù)理想主義轉(zhuǎn)向工程實用主義的標志性事件。它證明了,在現(xiàn)有硬件和物理約束條件下,通過計算拓撲結(jié)構(gòu)優(yōu)化獲得的邊際收益,遠高于單純增加芯片數(shù)量的線性增長。
這解釋了為何美國AI巨頭會產(chǎn)生戰(zhàn)略焦慮的深層因素——當工程創(chuàng)新能力開始在AI競爭中脫穎而出,硅谷長期主導(dǎo)的技術(shù)先發(fā)優(yōu)勢就面臨重估,而且它也將帶來AI敘事的重估,背后是資本和資本市場的重估。
宏觀趨勢研究學(xué)者、經(jīng)濟學(xué)家David Woo近日接受訪談時表示,過去兩年,人們一直在談?wù)撁绹?jīng)濟的“例外主義”,而AI是推動這一論斷形成的重要因素。美股市值占全球資本市場的份額達63%,其中ChatGPT出現(xiàn)后的兩年,就增加了10個百分點,而七大科技巨頭又占美股市值的25%。這些巨頭正是依靠AI技術(shù)的強大優(yōu)勢鞏固了它們的地位,從而間接鞏固了美國資本市場的優(yōu)勢地位。
因此,AI與美國科技巨頭、資本市場其實是捆綁在一起的,也正是硅谷和華爾街聯(lián)合主導(dǎo)了全球AI敘事。
如今,來自東方的神秘力量DeepSeek向這套AI敘事發(fā)起了沖鋒。全球科技和資本領(lǐng)域持續(xù)10多天的熱烈反應(yīng),可以從側(cè)面解釋科技巨頭的焦慮和資本市場為何如此緊張。截至2月3日美股盤前,英偉達股價自1月24日以來已跌去20%。當然,這不排除是投資者市場(避險)情緒的短期波動。
前述資深A(yù)I觀察人士認為,DeepSeek創(chuàng)造的歷史性價值有兩點:一是力行開源,本質(zhì)上是人類資源、科技創(chuàng)新的共享表達;二是提供了堆砌算力和數(shù)據(jù)之外的新的技術(shù)路徑。記者這幾天的采訪發(fā)現(xiàn),DeepSeek以上兩點貢獻,基本已成為業(yè)內(nèi)的共識。
在現(xiàn)實層面,DeepSeek也揭示了一個殘酷的真相:當創(chuàng)新進入深水區(qū),工程能力比學(xué)術(shù)突破更重要,成本控制比參數(shù)競賽更致命,社會接受度比算法精度更關(guān)鍵。
如果跳開地緣政治誰贏誰輸?shù)膯栴},僅僅著眼于行業(yè)本身,商業(yè)本質(zhì)在于,賺錢的公司才能活下去。當資本泡沫退去,或許我們會發(fā)現(xiàn),技術(shù)強大固然重要,但應(yīng)用和生存才是企業(yè)當下的現(xiàn)實,也是所有AI新創(chuàng)企業(yè)的必答題。
從“誰能燒錢造最大模型”,過渡到“誰能用最少錢辦最多事”;美國企業(yè)依然掌握著最先進的芯片,但中國企業(yè)找到了更省錢的玩法——這才是DeepSeek重新書寫的AI敘事。
畢竟,不是所有新創(chuàng)企業(yè)都像OpenAI、xAI動不動就能融資到60億美元。正是在這個意義上,DeepSeek的技術(shù)路線,受到全球大批AI企業(yè)的效仿,其開源策略受到全球研究機構(gòu)的稱贊,其價格策略引發(fā)全球消費者的熱捧。
高效率低成本的技術(shù)創(chuàng)新,加上全球關(guān)注的巨大流量,讓DeepSeek贏得了寶貴的時間窗口。這是堆積大量美元都難以買到的,也是OpenAI、Anthropic等AI新創(chuàng)企業(yè)羨慕甚至嫉妒的。