在3D生成大模型賽道,騰訊跑在了大廠的最前面。
1月22日,騰訊上線了首個(gè)一站式3D內(nèi)容AI創(chuàng)作平臺(tái)——混元3D AI創(chuàng)作引擎2.0,并正式宣布開(kāi)源。新版本包含基礎(chǔ)模型生成、3D功能矩陣、3D編輯、3D生成工作流、創(chuàng)作素材庫(kù)等功能,目前已面向用戶和開(kāi)發(fā)者開(kāi)放。
該引擎支持文生及圖生3D。用戶輸入中/英文提示詞,描述主體內(nèi)容、特征、風(fēng)格等,即可快速生成生成4個(gè)3D模型,同時(shí),也支持上傳單圖生成3D模型。效果上,可以選擇不同紋理風(fēng)格進(jìn)行生成。對(duì)比去年11月發(fā)布的1.0版本,2.0版本在生成效果上有明顯提升。
AI正在3D模型生成中扮演日漸重要的角色。游戲制作、社交、電商廣告、工業(yè)制造、具身智能、自動(dòng)駕駛、AR/VR、三維打印等多個(gè)領(lǐng)域都已開(kāi)始應(yīng)用AI能力輔助3D內(nèi)容生產(chǎn)。以游戲制作為例,3D管線(即將 3D 場(chǎng)景數(shù)據(jù)轉(zhuǎn)化為最終呈現(xiàn)在屏幕上的 2D 圖像)是最為核心的環(huán)節(jié)之一,但同時(shí)也最考驗(yàn)時(shí)間和資金成本。
美術(shù)成本往往占一款游戲開(kāi)發(fā)總成本的50%,而3D模型成本占美術(shù)總成本的30%~40%。錦秋基金報(bào)告中也提及,一個(gè)十萬(wàn)面以上的3D高模資源,廠商如果委托外包團(tuán)隊(duì)生產(chǎn),價(jià)格至少需要3萬(wàn)元,時(shí)間需要30-45天。如果在3D資產(chǎn)庫(kù)購(gòu)買,除了存在可選資產(chǎn)有限的問(wèn)題,通常也需要5-10人/天進(jìn)行清洗才可以使用。
而3D生成大模型能夠在很大程度上改變這種現(xiàn)狀。騰訊游戲在研項(xiàng)目研發(fā)制作人王智剛提到,混元3D AI創(chuàng)作引擎已經(jīng)開(kāi)始支持騰訊游戲、地圖、元寶等業(yè)務(wù)的部分需求。以游戲?yàn)槔?,在混元的支持下,騰訊游戲業(yè)務(wù)3D資產(chǎn)制作時(shí)間成本可從5-10天級(jí)別下降到分鐘級(jí)。對(duì)于微信小游戲這類輕度游戲的3D生成需求,也基本可以實(shí)現(xiàn)覆蓋。
對(duì)3D模型生成有高頻需求的不止是游戲行業(yè)。當(dāng)AI走向更高階的水平,它將不僅限于對(duì)文本、圖像、視頻等1D或者2D內(nèi)容的理解,而是不斷發(fā)展成理解真實(shí)物理世界的三維空間,這也是具身智能、自動(dòng)駕駛等廠商的剛需。它們很難在現(xiàn)實(shí)中采集到全面、多樣的訓(xùn)練數(shù)據(jù),而AI生成的3D模型則能夠補(bǔ)充這種能力。
騰訊混元3D負(fù)責(zé)人郭春超透露,目前已經(jīng)有一批具身智能、自動(dòng)駕駛廠商來(lái)尋求合作。
不過(guò),相比起文生圖等較為成熟的生成式AI應(yīng)用,3D模型的技術(shù)成熟度還遠(yuǎn)遠(yuǎn)不夠。郭春超認(rèn)為,3D模型面臨的主要挑戰(zhàn)之一是數(shù)據(jù)量不足。相較于文本和2D圖像數(shù)據(jù),可供訓(xùn)練的3D數(shù)據(jù)并不多,且經(jīng)過(guò)標(biāo)注和語(yǔ)義匹配的3D數(shù)據(jù)則更為稀缺。對(duì)于3D數(shù)據(jù)的積累,也將是未來(lái)3D模型生成企業(yè)的一項(xiàng)核心競(jìng)爭(zhēng)力。
“3D模型生產(chǎn)的視覺(jué)合格率僅用一年時(shí)間就從20%提升到60%的水平,發(fā)展非???。但是相比于生文達(dá)到95%,生圖達(dá)到90%以上,它的成熟度、可用性仍然處在前半賽場(chǎng)。”郭春超說(shuō)。
在此前大廠紛紛重注的文生圖、文生視頻等領(lǐng)域,騰訊的動(dòng)作在國(guó)內(nèi)互聯(lián)網(wǎng)大廠中相對(duì)較慢,但卻是最早下場(chǎng)做3D生成大模型的互聯(lián)網(wǎng)大廠。原因或許在于,騰訊自身的業(yè)務(wù)具有大量相關(guān)需求,這同時(shí)也讓騰訊對(duì)其中的商業(yè)價(jià)值更為敏銳。郭春超認(rèn)為,3D生成大模型面向游戲行業(yè)的商業(yè)價(jià)值確定性非常高,國(guó)內(nèi)有百萬(wàn)級(jí)游戲從業(yè)者,背后是百億乃至千億級(jí)的市場(chǎng)。
其他大廠也開(kāi)始在3D領(lǐng)域排兵布陣。今年年初,美團(tuán)旗下龍珠資本與字節(jié)跳動(dòng)聯(lián)手領(lǐng)投了一家名為影眸科技的3D生成大模型公司,后者目前已經(jīng)獲得數(shù)百萬(wàn)元企業(yè)端商業(yè)化訂單。除了影眸之外,國(guó)內(nèi)另一家備受資本追捧的國(guó)內(nèi)廠商是VAST,創(chuàng)始人宋亞宸曾在商湯科技及MiniMax任職,目前公司超過(guò)400家。
郭春超認(rèn)為,騰訊與上述廠商的區(qū)別在于,它不僅僅定位于專業(yè)的3D工具,更想成為一款低門(mén)檻、覆蓋面廣的一站式創(chuàng)作引擎,用戶可以在上面自由創(chuàng)作、生成、編輯,相當(dāng)于3D版的“秒剪”。在他看來(lái),目前的2.0版本還遠(yuǎn)未達(dá)到上限。春節(jié)過(guò)后,它還將開(kāi)放類似三維場(chǎng)景漫游等更大的場(chǎng)景生成,可應(yīng)用于AR、VR、線上展館等領(lǐng)域。
相較于初創(chuàng)公司,騰訊的優(yōu)勢(shì)在于能夠以更低的成本從自身業(yè)務(wù)中積累數(shù)據(jù),也能從中找到大量應(yīng)用場(chǎng)景。但不同行業(yè)對(duì)3D生成效果的要求也大不相同,騰訊需要拿出更多資源來(lái)應(yīng)對(duì)初創(chuàng)公司對(duì)細(xì)分行業(yè)的針對(duì)性打磨。
不過(guò),AI生成3D模型賽道還遠(yuǎn)未到達(dá)“Sora”時(shí)刻。技術(shù)角逐才剛剛開(kāi)始,這些公司仍然有足夠的時(shí)間和金錢來(lái)應(yīng)對(duì)挑戰(zhàn)。