DeepSeek沖擊波還在持續(xù),而且已經(jīng)從科技圈蔓延至資本圈。
1月27日,由國(guó)產(chǎn)大模型公司深度求索開(kāi)發(fā)的移動(dòng)應(yīng)用DeepSeek超越ChatGPT登頂蘋(píng)果美國(guó)區(qū)免費(fèi)應(yīng)用榜單。同日,蘋(píng)果中國(guó)區(qū)應(yīng)用商店的免費(fèi)榜也顯示,DeepSeek為榜單第一。由于用戶源源不斷地涌入DeepSeek,繼昨天下午出現(xiàn)局部服務(wù)波動(dòng)導(dǎo)致數(shù)分鐘的短暫系統(tǒng)崩潰后,DeepSeek今日上午又火到“宕機(jī)”,服務(wù)狀態(tài)頁(yè)面顯示網(wǎng)頁(yè)/API不可用。據(jù)DeepSeek回應(yīng)稱,可能與服務(wù)維護(hù)、請(qǐng)求限制等因素有關(guān)。
同時(shí),DeepSeek這匹“AI黑馬”也在資本界掀起了滔天巨浪。由于DeepSeek通過(guò)結(jié)構(gòu)化稀疏注意力、混合專家系統(tǒng)、動(dòng)態(tài)計(jì)算路由等技術(shù),顯著降低了模型訓(xùn)練和推理的算力消耗,由此引發(fā)了市場(chǎng)關(guān)于算力需求下降的擔(dān)憂。受此影響,美股科技巨頭股價(jià)盤(pán)前集體大跌,英偉達(dá)跌超8%,超威半導(dǎo)體一度跌超5%,臺(tái)積電一度跌逾8%,博通跌近9%。除此以外,歐洲股市方面,光刻機(jī)巨頭阿斯麥跌近10%;A股AI算力指數(shù)今日跌3.94%,寒武紀(jì)一度跌10%,中際旭創(chuàng)跌超10%,工業(yè)富聯(lián)跌超8%。
DeepSeek火遍國(guó)內(nèi)外
這兩天,爆火的DeepSeek已在海內(nèi)外引發(fā)諸多討論。
記者注意到,華爾街頂級(jí)風(fēng)投A16Z的創(chuàng)始人、被稱為風(fēng)投教父的MarcAndreessen今日在社交平臺(tái)上發(fā)文稱,“DeepSeek是AI的斯普特尼克時(shí)刻”。所謂的“斯普特尼克時(shí)刻”,指的是1957年蘇聯(lián)成功發(fā)射第一顆人造衛(wèi)星斯普特尼克1號(hào)。這一比喻充分說(shuō)明了DeepSeek在生成式人工智能時(shí)代帶來(lái)的震動(dòng)與沖擊。
國(guó)內(nèi)方面,有關(guān)DeepSeek的多個(gè)詞條在27日登上了微博熱搜。許多體驗(yàn)了DeepSeek的網(wǎng)友紛紛發(fā)帖,對(duì)其思考的深度水平、回答的智能程度給予了高度評(píng)價(jià)。有網(wǎng)友表示,“DeepSeek思考的方向比我全面多了,更不要談它的知識(shí)儲(chǔ)備比我豐富好幾千倍。”有醫(yī)生編了幾個(gè)病例讓DeepSeek給出診療意見(jiàn)和治療方案,DeepSeek給出的方案“毫無(wú)錯(cuò)誤,思考全面而且專業(yè)”。網(wǎng)友“自來(lái)水”地曬使用體驗(yàn),這一現(xiàn)象不禁讓人想起2022年底OpenAI剛剛發(fā)布ChatGPT后,大家爭(zhēng)先恐后試用并“秀對(duì)話框”的場(chǎng)景。
黑神話悟空的創(chuàng)始人馮驥也在微博發(fā)文評(píng)價(jià)DeepSeek。他說(shuō)自己已經(jīng)使用V3一個(gè)月了,最新發(fā)布的R1則剛剛使用5天。馮驥認(rèn)為“DeepSeek可能是個(gè)國(guó)運(yùn)級(jí)別的科技成果”,不僅強(qiáng)大、便宜、免費(fèi),而且開(kāi)源,任何人都可以自行下載和部署,提供論文詳細(xì)說(shuō)明訓(xùn)練步驟與竅門(mén)。“深度求索是一家很小規(guī)模的年輕中國(guó)公司,由沒(méi)有海外經(jīng)歷甚至沒(méi)有自身從業(yè)經(jīng)驗(yàn)的本土團(tuán)隊(duì)開(kāi)發(fā)完成?!瘪T驥說(shuō),“太幸運(yùn)了!太開(kāi)心了!這樣震撼的突破,來(lái)自一個(gè)純粹的中國(guó)公司。”
值得注意的是,DeepSeek暫時(shí)是目前唯一支持聯(lián)網(wǎng)搜索的推理模型,這使得DeepSeek的回答能夠結(jié)合最新的互聯(lián)網(wǎng)數(shù)據(jù),相較其他模型準(zhǔn)確性更強(qiáng)。記者實(shí)測(cè)發(fā)現(xiàn),當(dāng)讓DeepSeek寫(xiě)一份其創(chuàng)始人梁文峰的簡(jiǎn)歷時(shí),它不僅能梳理出梁文峰的基本信息、在浙江大學(xué)的教育背景以及量化投資領(lǐng)域的職業(yè)經(jīng)歷,還能抓取到梁文峰“2025年1月受邀參加國(guó)務(wù)院總理座談會(huì),代表AI領(lǐng)域建言獻(xiàn)策”的最新媒體報(bào)道。
DeepSeek沖擊算力股
作為“國(guó)產(chǎn)大模型之光”,DeepSeek不僅引發(fā)了硅谷的震動(dòng),也讓華爾街陷入了恐慌。受此影響,美股科技巨頭股價(jià)盤(pán)前集體大跌,英偉達(dá)跌超8%,超威半導(dǎo)體一度跌超5%,臺(tái)積電一度跌逾8%,博通跌近9%。除此以外,歐洲股市方面,光刻機(jī)巨頭阿斯麥跌近10%;日本股市方面,英偉達(dá)的主要供應(yīng)商Advantest Corp.一度暴跌超8%。
A股方面,AI算力指數(shù)今日跌3.94%,寒武紀(jì)一度跌10%,中際旭創(chuàng)跌超10%,工業(yè)富聯(lián)跌超8%。值得注意的是,被稱為“英偉達(dá)影子股”的高速銅纜概念股沃爾核材,以及英偉達(dá)BlackwellGB200供應(yīng)商英維克今日也雙雙跌停。
DeepSeek的成功對(duì)算力板塊構(gòu)成了巨大的沖擊。分析人士認(rèn)為,DeepSeek在有限的硬件資源下實(shí)現(xiàn)頂尖的模型性能,減少了對(duì)高端GPU的依賴,低廉的訓(xùn)練成本預(yù)示著AI大模型對(duì)算力投入的需求將大幅下降。
值得注意的是,就在前幾天,剛剛上任的美國(guó)總統(tǒng)特朗普宣布,OpenAI、軟銀集團(tuán)和甲骨文將合資成立一家名為“星際之門(mén)”(Stargate)的新公司,計(jì)劃未來(lái)四年在美國(guó)投資5000億美元建設(shè)AI基礎(chǔ)設(shè)施,其中1000億美元將立即部署。該項(xiàng)目是歷史上最大的AI基礎(chǔ)設(shè)施項(xiàng)目,因投資金額之巨大,也被稱為美國(guó)的“AI曼哈頓計(jì)劃”。
除此以外,美股科技巨頭最近一段時(shí)間也公布了高額的AI資本開(kāi)支計(jì)劃。例如,微軟宣布投入800億美元用于AI數(shù)據(jù)中心建設(shè),Meta的創(chuàng)始人扎克伯格最近也表示,Meta正在建設(shè)一個(gè)2GW+數(shù)據(jù)中心,將擁有超過(guò)130塊GPU,計(jì)劃今年將投入600億美元—650億美元用于AI資本開(kāi)支。
DeepSeek讓人們開(kāi)始質(zhì)疑大規(guī)模算力基建投入的效用。美股大V“THESHORTBEAR”在社交媒體上表示,“DeepSeek創(chuàng)造了一個(gè)AI巨頭們的痛苦時(shí)刻,而投資者必須對(duì)此敲響警鐘?!庇捎诿拦蛇^(guò)去兩年狂飆猛進(jìn),背后其實(shí)是AI浪潮下“美股科技七姐妹”以及英偉達(dá)支撐的主要結(jié)果,華爾街擔(dān)心DeepSeek可能會(huì)對(duì)美國(guó)股市構(gòu)成沖擊。
記者向DeepSeek提出了“DeepSeek利空算力嗎?”這一問(wèn)題,有意思的是,DeepSeek給出的結(jié)論是,“算力需求將長(zhǎng)期增長(zhǎng),但市場(chǎng)結(jié)構(gòu)將重塑?!彼M(jìn)一步解釋稱,DeepSeek的算法優(yōu)化可能短期內(nèi)抑制訓(xùn)練端的高端GPU需求,但應(yīng)用端的爆發(fā)將推動(dòng)推理算力需求增長(zhǎng)。類比“發(fā)動(dòng)機(jī)效率提升反而增加石油需求”,算力總需求可能隨AI普及而擴(kuò)張,因此短期局部利空,但長(zhǎng)期整體利好。
至于對(duì)產(chǎn)業(yè)鏈的沖擊尤其是對(duì)英偉達(dá)和OpenAI的影響,DeepSeek表示閉源模型將(如OpenAI)面臨開(kāi)源社區(qū)的競(jìng)爭(zhēng)壓力,其API商業(yè)價(jià)值可能被稀釋;英偉達(dá)在訓(xùn)練端的優(yōu)勢(shì)雖穩(wěn)固,但推理端可能受AMD等廠商挑戰(zhàn)。同時(shí),華為昇騰、寒武紀(jì)等國(guó)產(chǎn)芯片廠商因適配DeepSeek獲得技術(shù)驗(yàn)證機(jī)會(huì),未來(lái)或受益于國(guó)產(chǎn)替代趨勢(shì)。
復(fù)盤(pán)DeepSeek爆火的一周
事實(shí)上,DeepSeek并非“一夜爆火”,它的出圈早已有跡可循。去年年底,DeepSeek的全新系列模型DeepSeek-V3首個(gè)版本上線并同步開(kāi)源。由于模型性能超越或媲美全球頂級(jí)的開(kāi)源及閉源模型,同時(shí)訓(xùn)練成本極低,DeepSeek-V3以史無(wú)前例的性價(jià)比被國(guó)內(nèi)外一眾圈內(nèi)大佬點(diǎn)贊。這是DeepSeek第一次在海外引起廣泛關(guān)注。
自上周末起,海內(nèi)外關(guān)于DeepSeek的討論開(kāi)始甚囂塵上,其導(dǎo)火索是DeepSeek一周前發(fā)布的最新模型DeepSeek-R1。記者梳理了一下DeepSeek-R1發(fā)布后的幾個(gè)重要時(shí)間線:
1月20日,DeepSeek-R1正式發(fā)布并同步開(kāi)源模型權(quán)重。據(jù)官方介紹,DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù)(RL),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力。在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上,性能比肩OpenAIo1正式版。由于對(duì)標(biāo)海外先進(jìn)模型的說(shuō)法在國(guó)產(chǎn)大模型領(lǐng)域比較普遍,R1模型的發(fā)布當(dāng)時(shí)并未引起太多人的重視。
1月21日至23日,由于DeepSeek在發(fā)布R1的同時(shí)還公布了技術(shù)報(bào)告《DeepSeek-R1:強(qiáng)化學(xué)習(xí)驅(qū)動(dòng)的大語(yǔ)言模型推理能力提升》,AI界一些有影響力的人閱讀了DeepSeek的技術(shù)報(bào)告,并對(duì)此感到震撼。例如,英偉達(dá)高級(jí)研究科學(xué)家JimFan在讀完報(bào)告后表示,“我們正身處這樣一個(gè)歷史時(shí)刻:一家非美國(guó)公司正在延續(xù)OpenAI最初的使命——通過(guò)真正開(kāi)放的前沿研究賦能全人類??此撇缓铣@?,但最有趣的結(jié)局往往最可能成真?!盌eepSeek開(kāi)始在AI界小范圍引起討論。
1月24日至25日,紐約時(shí)報(bào)、金融時(shí)報(bào)等英美主流媒體開(kāi)始大量報(bào)道DeepSeek,關(guān)注的焦點(diǎn)主要是中國(guó)的AI創(chuàng)業(yè)公司DeepSeek是否會(huì)撼動(dòng)美國(guó)硅谷在人工智能領(lǐng)域的領(lǐng)先地位。其中,紐約時(shí)報(bào)發(fā)表了題為《中國(guó)的AI創(chuàng)業(yè)公司如何與硅谷巨頭競(jìng)爭(zhēng)》的文章,文章指出,“中國(guó)可能通過(guò)開(kāi)源主導(dǎo)權(quán)重構(gòu)全球AI競(jìng)爭(zhēng)格局,使低成本創(chuàng)新成為顛覆行業(yè)的新路徑”。
與此同時(shí),DeepSeek的影響力開(kāi)始向資本市場(chǎng)滲透。1月24日,知名投資人MarcAndreessen在社交平臺(tái)表示,“DeepSeekR1是我見(jiàn)過(guò)的最令人驚嘆,最令人印象深刻的突破之一,并且是開(kāi)源的,是給全世界的禮物。”1月24日,英偉達(dá)股價(jià)大跌超3%。據(jù)媒體報(bào)道,JPM交易臺(tái)當(dāng)晚交易時(shí)95%的問(wèn)題均和DeepSeek有關(guān),交易員、分析師周末開(kāi)始惡補(bǔ)關(guān)于DeepSeek的一切。
據(jù)擁有20年投資經(jīng)驗(yàn)的大V“TMTBreakout”總結(jié),DeepSeek的爆火可能有四點(diǎn)原因,首先是社交平臺(tái)X的算法推薦,其次是知名投資人MarcAndreessen的推文,再次是紐約時(shí)報(bào)的文章,最后是英偉達(dá)股價(jià)的下跌。DeepSeek的R1模型發(fā)布若干天后,才在海外引起軒然大波,有業(yè)內(nèi)人士分析稱,這側(cè)面表明中國(guó)本土的AI科研走到了技術(shù)的最前沿。
校對(duì):王錦程