無(wú)產(chǎn)品、無(wú)用戶、無(wú)收入,一家“三無(wú)”創(chuàng)業(yè)公司,憑什么獲得英偉達(dá)和谷歌的青睞?
由前OpenAI首席科學(xué)家伊爾亞·蘇茨克維(Ilya Sutskever)創(chuàng)辦的AI創(chuàng)業(yè)公司Safe Superintelligence(安全超級(jí)智能)傳來(lái)最新一輪融資新進(jìn)展。據(jù)外媒報(bào)道,安全超級(jí)智能已在最新一輪融資中籌集了20億美元(約合人民幣146億元),估值由去年9月的50億美元飆升至320億美元。
值得注意的是,消息還透露,芯片巨頭英偉達(dá)和谷歌母公司Alphabet都將參與安全超級(jí)智能的投資。在AI浪潮中,英偉達(dá)憑借著高性能的GPU成為獨(dú)占鰲頭的算力霸主,成為各家企業(yè)訓(xùn)練模型、處理AI相關(guān)算力需求的標(biāo)配。但英偉達(dá)并非完全“高枕無(wú)憂”,由谷歌率先推出的TPU芯片如今應(yīng)用范圍正逐步擴(kuò)大。就在幾天以前,安全超級(jí)智能還宣布與谷歌云正式建立合作伙伴關(guān)系,將利用谷歌云的TPU芯片加速其AI研發(fā)工作。
隨著英偉達(dá)也成為投資方,未來(lái)安全超級(jí)智能將主要使用何種芯片進(jìn)行AI研發(fā)或?qū)澤弦粋€(gè)問(wèn)號(hào)。業(yè)內(nèi)人士認(rèn)為,芯片廠商及云服務(wù)商掀起投資AI創(chuàng)企的熱潮,更深層次的考量是擴(kuò)大其芯片的服務(wù)范圍和市場(chǎng)份額,構(gòu)建良好的AI基礎(chǔ)設(shè)施生態(tài)。
前OpenAI首席科學(xué)家,成為融資金字招牌
安全超級(jí)智能成立于去年6月,不到一年的時(shí)間里,公司并未發(fā)布任何產(chǎn)品,也沒(méi)有任何用戶及收入,但卻擁有極強(qiáng)的“吸金”能力,不費(fèi)吹灰之力就以超300億美元估值躋身AI獨(dú)角獸之列。這背后,離不開公司靈魂人物蘇茨克維的強(qiáng)大號(hào)召力。
公開資料顯示,蘇茨克維生于1985年,是以色列裔加拿大計(jì)算機(jī)科學(xué)家、機(jī)器學(xué)習(xí)領(lǐng)域的頂尖學(xué)者和領(lǐng)軍人物。在多倫多大學(xué)求學(xué)期間,他師從人工智能先驅(qū)杰弗里·辛頓(Geoffrey Hinton),并與之共同建立了一個(gè)名為AlexNet的神經(jīng)網(wǎng)絡(luò),首次證明了在GPU上訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)可以將圖像識(shí)別任務(wù)提升到一個(gè)新的水平。
2012年畢業(yè)后,蘇茨克維加入了導(dǎo)師杰弗里·辛頓的新研究公司DNNResearch。2013年,谷歌收購(gòu)了DNNResearch,并聘請(qǐng)?zhí)K茨克維擔(dān)任Google Brain(谷歌大腦,谷歌在人工智能領(lǐng)域的一個(gè)重要研究項(xiàng)目)的研究科學(xué)家。
因此,蘇茨克維與谷歌早已結(jié)緣。而且在谷歌工作期間,蘇茨克維還參與了多項(xiàng)具有真正開創(chuàng)性意義的研究工作。比如,蘇茨克維參與了谷歌開源庫(kù)TensorFlow的開發(fā),用于大規(guī)模機(jī)器學(xué)習(xí),TensorFlow具有許多便利的功能和實(shí)用程序,是如今世界上最流行的機(jī)器學(xué)習(xí)系統(tǒng)。此外,蘇茨克維還協(xié)助谷歌DeepMind的研究人員開發(fā)了劃時(shí)代的圍棋人工智能AlphaGo。關(guān)于AlphaGo的論文于2016年發(fā)表,蘇茨克維是合著者。
2015年,蘇茨克維離開谷歌,正式加入了OpenAI,成為該公司的聯(lián)合創(chuàng)始人兼首席科學(xué)家。蘇茨克維在科學(xué)和工程實(shí)現(xiàn)上為ChatGPT的誕生作出了巨大貢獻(xiàn),也被譽(yù)為“ChatGPT之父”。業(yè)內(nèi)人士普遍認(rèn)為,如果沒(méi)有蘇茨克維,也就不會(huì)有ChatGPT的出現(xiàn)。
2024年5月,蘇茨克維從OpenAI離職,并在一個(gè)月后創(chuàng)立了安全超級(jí)智能。公司的另外兩名聯(lián)創(chuàng)分別是前蘋果AI高管Daniel Gross和前OpenAI技術(shù)團(tuán)隊(duì)成員Daniel Levy。前者不僅在蘋果就職期間推動(dòng)了機(jī)器學(xué)習(xí)技術(shù)的集成與應(yīng)用,而且還是知名的科技風(fēng)險(xiǎn)投資人,參與了GitHub的早期投資,而且持有Perplexity和Character AI等知名AI初創(chuàng)公司的股份。后者則在OpenAI期間與蘇茨克維一起訓(xùn)練大模型,對(duì)深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)有深刻的理解。
正是基于蘇茨克維在行業(yè)內(nèi)極高的影響力和聲譽(yù),盡管安全超級(jí)智能成立至今未發(fā)布任何產(chǎn)品,依然有許多投資者愿意押注。去年9月,安全超級(jí)智能宣布融資10億美元,估值超過(guò)50億美元,投資方包括紅杉資本、A16Z、DST Global、SV Angel、NFDG等知名投資機(jī)構(gòu)。今年2月,市場(chǎng)消息稱,安全超級(jí)智能將完成超10億美元的新一輪融資,估值超300億美元。
近日,最新一輪融資又傳來(lái)新進(jìn)展,公司已在最新一輪融資中籌集了20億美元,估值由去年9月的50億美元飆升至320億美元,且芯片巨頭英偉達(dá)和谷歌母公司Alphabet都將參與安全超級(jí)智能的投資。
AI創(chuàng)企投資背后的AI基礎(chǔ)設(shè)施之爭(zhēng)
有觀點(diǎn)認(rèn)為,吸引投資者的,除了蘇茨克維的強(qiáng)大號(hào)召力,還有其帶領(lǐng)團(tuán)隊(duì)正在研究的創(chuàng)新方法。
據(jù)了解,蘇茨克維是在AI行業(yè)中最早倡導(dǎo)Scaling Law(縮放定律,即模型性能將隨著投入的計(jì)算能力及數(shù)據(jù)量增大而顯著增強(qiáng))的研究者之一,并在這一理念的指引下實(shí)現(xiàn)了ChatGPT的創(chuàng)新突破。
然而,近年來(lái)Scaling Law有趨勢(shì)放緩的跡象,而蘇茨克維也很早就意識(shí)到高質(zhì)量數(shù)據(jù)的日益枯竭,將使模型訓(xùn)練面臨越來(lái)越多的掣肘,從而使得“大力出奇跡”的方法論逐漸失效。在接受媒體采訪時(shí),蘇茨克維曾表示,安全超級(jí)智能正在追求一個(gè)新的研究方向,正在攀登一座“新的山峰”,并且強(qiáng)調(diào)這與他之前在OpenAI所從事的工作不同。不過(guò),蘇茨克維并未透露具體細(xì)節(jié)。
許多跡象表明,這個(gè)新的研究方向,或與AI基礎(chǔ)設(shè)施相關(guān)。這條與通過(guò)無(wú)限堆“算力”解鎖“智能”的OpenAI所不同的技術(shù)路線,或有望改變當(dāng)前GPU一統(tǒng)天下的格局。
今年4月10日,安全超級(jí)智能宣布與谷歌云正式建立合作伙伴關(guān)系,將利用谷歌云的TPU芯片加速其AI研發(fā)工作。谷歌云也透露,安全超級(jí)智能正借助其TPU提升研發(fā)速度,以構(gòu)建安全的超級(jí)智能AI。業(yè)內(nèi)人士分析稱,雙方合作意味著安全超級(jí)智能將把其大部分計(jì)算預(yù)算投入到谷歌云,谷歌云將成為其主要的計(jì)算服務(wù)提供商。
作為谷歌率先提出的、為滿足機(jī)器學(xué)習(xí)算法日益增長(zhǎng)的計(jì)算需求而設(shè)計(jì)的芯片,TPU在針對(duì)深度學(xué)習(xí)模型的訓(xùn)練和推理上具有優(yōu)秀的效果。咨詢公司D2D Advisory首席執(zhí)行官Jay Goldberg曾直言,如今只有兩家公司有成熟的芯片研發(fā)體系來(lái)訓(xùn)練人工智能模型,一個(gè)是英偉達(dá)的GPU,另一個(gè)是谷歌的TPU。
自推出以來(lái),TPU已從專為谷歌內(nèi)部使用的芯片發(fā)展為面向全球市場(chǎng)的產(chǎn)品。除了谷歌自身的Gemini系列大模型依賴TPU芯片進(jìn)行訓(xùn)練以外,蘋果、Anthropic等公司在構(gòu)建大模型時(shí)也大量使用了谷歌的TPU芯片。
知情人士透露,安全超級(jí)智能目前主要使用TPU而不是GPU進(jìn)行研發(fā)。負(fù)責(zé)谷歌與初創(chuàng)公司合作的董事總經(jīng)理達(dá)倫·莫里最近在接受媒體采訪時(shí)表示,谷歌向安全超級(jí)智能銷售了大量芯片,以支持其前沿AI的研究,這體現(xiàn)了谷歌擴(kuò)大對(duì)外部客戶銷售的持續(xù)戰(zhàn)略。他進(jìn)一步表示,“和這些基礎(chǔ)模型構(gòu)建者合作,我們的吸引力正大幅提升。”
國(guó)內(nèi)領(lǐng)先的TPU架構(gòu)AI芯片企業(yè)中昊芯英創(chuàng)始人兼CEO楊龔軼凡曾在接受證券時(shí)報(bào)記者采訪時(shí)表示,TPU是為了AI的深度學(xué)習(xí)而設(shè)計(jì)的,它的想象力比GPU更強(qiáng),雖然放棄了一些靈活性,但也獲取了巨大的性能優(yōu)勢(shì)。針對(duì)大模型的模型訓(xùn)練和推理性設(shè)計(jì),一方面,TPU軟件和網(wǎng)絡(luò)的架構(gòu)和結(jié)構(gòu)比GPU實(shí)現(xiàn)同樣性能的網(wǎng)絡(luò)架構(gòu)更為簡(jiǎn)潔和簡(jiǎn)單,在軟件的運(yùn)維層面也會(huì)更簡(jiǎn)潔一些;另一方面,在硬件的搭載過(guò)程中,也會(huì)設(shè)計(jì)讓它實(shí)現(xiàn)可運(yùn)維,盡可能降低生產(chǎn)成本、運(yùn)維成本,最后實(shí)現(xiàn)對(duì)模型的高算力的支持。
一名資深的業(yè)內(nèi)人士告訴證券時(shí)報(bào)記者,與GPU相比,TPU設(shè)計(jì)可用于高體量的低精度計(jì)算,每焦耳有更多的輸入/輸出操作且沒(méi)有光柵化/紋理映射的硬件,這些特性使TPU對(duì)AI專項(xiàng)的優(yōu)化能力更強(qiáng),更適合研究和構(gòu)建新型神經(jīng)網(wǎng)絡(luò)架構(gòu)。行業(yè)苦高昂的算力成本久矣,且在Scaling Law放緩的背景下,TPU被業(yè)界期待能夠另辟蹊徑。因此,英偉達(dá)與谷歌對(duì)于安全超級(jí)智能的投資,指向的或是更深層次AI基礎(chǔ)設(shè)施之爭(zhēng)。
基礎(chǔ)模型構(gòu)建者是AI算力的重要客戶,其前沿模型的研發(fā)往往依賴于外部芯片廠商的供給。OpenAI此前高度依賴投資方微軟為其提供算力,使用的主要是英偉達(dá)的芯片,而谷歌則投資了OpenAI最大的競(jìng)爭(zhēng)對(duì)手Anthropic以及OpenAI未來(lái)潛在的競(jìng)爭(zhēng)對(duì)手安全超級(jí)智能,這兩家公司均使用谷歌的TPU芯片研發(fā)模型。業(yè)內(nèi)人士認(rèn)為,芯片廠商及云服務(wù)商掀起投資AI創(chuàng)企的熱潮,更深層次的考量是擴(kuò)大其芯片的服務(wù)范圍和市場(chǎng)份額,構(gòu)建良好的AI基礎(chǔ)設(shè)施生態(tài),以提升自身的行業(yè)優(yōu)勢(shì)地位。
校對(duì):彭其華