12月18日上午,“2024火山引擎FORCE原動力大會·冬”拉開帷幕。會議現(xiàn)場座無虛席,備受關注的豆包大模型將有哪些重要升級等話題,吸引了超千名關注AI進展的聽眾來到現(xiàn)場。
這次大會的一個重要看點就是,豆包大模型全面升級,同時,繼大語言模型價格以厘計算之后,視覺理解模型也宣告進入“厘時代”。
豆包視覺理解模型定價進入“厘時代”
與諸多大廠的大模型大會不同,字節(jié)跳動別出心裁,本次大會主持人并非真人,而是虛擬的“豆包”。
火山引擎總裁譚待在大會上介紹,豆包大模型發(fā)布以來,在7個月時間里,日均tokens增長超過33倍,日均tokens使用量超過4萬億。
大模型應用加速滲透。豆包調用量上,信息處理場景增長39倍,硬件助手場景增長13倍,AI工具場景增長9倍。
當日,字節(jié)跳動豆包大模型家族全面升級。
其中,豆包視覺理解模型,通過視覺識別還可以進一步推理和計算,擁有更強的理解和推理能力。同時還有更細膩的視覺描述能力,比如孩子一幅涂鴉,豆包就可以創(chuàng)作一篇奇思妙想的故事;旅游場景方面,可以識別外文菜單、介紹建筑知識等。
“視覺理解拓展場景邊界,模型發(fā)展進入新階段?!弊T待表示。
更值得關注的是價格。豆包視覺模型比行業(yè)平均價格低85%,單價為0.003元。這使視覺理解模型首次進入“厘時代”。
此前,豆包視覺理解模型已經(jīng)接入豆包App和PC端產(chǎn)品。豆包戰(zhàn)略研究負責人周昊表示:“豆包一直在努力,讓用戶的輸入更快更方便”。為此,豆包產(chǎn)品非常注重多模態(tài)的輸入和打磨,包括語音、視覺等能力,這些模型都已通過火山引擎開放給企業(yè)客戶。
會上,豆包3D生成模型也首次亮相。該模型與火山引擎數(shù)字孿生平臺veOmniverse結合使用,可以高效完成智能訓練、數(shù)據(jù)合成和數(shù)字資產(chǎn)制作,成為一套支持 AIGC 創(chuàng)作的物理世界仿真模擬器。
豆包大模型多款產(chǎn)品也迎來重要更新:豆包通用模型pro已全面對齊GPT-4o,使用價格僅為后者的1/8;音樂模型從生成60秒的簡單結構,升級到生成3分鐘的完整作品;文生圖模型2.1版本,更是在業(yè)界首次實現(xiàn)精準生成漢字和一句話P圖的產(chǎn)品化能力,該模型已接入即夢AI和豆包App。
即夢Dreamina張楠認為,生成式AI技術可以把每個人腦子里的奇思妙想快速視覺化,“像做夢一樣”。即夢希望成為“想象力世界”的相機,記錄每個人的奇思妙想,幫助每個有想法的人輕松表達、自由創(chuàng)作。
大模型應用加速落地
大會透露,豆包大模型已經(jīng)與八成主流汽車品牌合作,并接入到多家手機、PC等智能終端,覆蓋終端設備約3億臺,來自智能終端的豆包大模型調用量在半年時間內增長100倍。
在公布豆包視覺理解模型超低定價的同時,火山引擎升級了火山方舟、扣子和 HiAgent 三款平臺產(chǎn)品,幫助企業(yè)構建好自身的 AI 能力中心,高效開發(fā) AI 應用。其中,火山方舟發(fā)布了大模型記憶方案,并推出 prefix cache 和 session cache API,降低延遲和成本?;鹕椒街圻€帶來全域 AI 搜索,具備場景化搜索推薦一體化、企業(yè)私域信息整合等服務。
云原生是過去十年最重要的計算范式,大模型時代則推動著云計算的變革?;鹕揭嬲J為,下一個十年,計算范式應該從云原生進入到AI云原生的新時代。
基于AI云原生的理念,火山引擎推出了新一代計算、網(wǎng)絡、存儲和安全產(chǎn)品。在計算層面,火山引擎GPU實例,通過vRDMA網(wǎng)絡,支持大規(guī)模并行計算和P/D分離推理架構,顯著提升訓練和推理效率,降低成本;存儲上,新推出的EIC彈性極速緩存,能夠實現(xiàn)GPU直連,使大模型推理時延降低至1/50、成本降低20%;在安全層面,火山將推出PCC私密云服務,構建大模型的可信應用體系?;赑CC,企業(yè)能夠實現(xiàn)用戶數(shù)據(jù)在云上推理的端到端加密,而且性能很好,推理時延與明文模式的差異在5%以內。
譚待說:“今年是大模型高速發(fā)展的一年。當你看到一列高速行駛的列車,最重要的事就是確保自己要登上這趟列車。通過AI云原生和豆包大模型家族,火山引擎希望幫助企業(yè)做好AI創(chuàng)新,駛向更美好的未來?!?/p>
“真”合作伙伴來了
對于這次發(fā)布會,二級市場早已經(jīng)預期滿滿。
近期,豆包概念連續(xù)活躍多天,不少概念股票走高。由此,豆包概念股也成為繼Kimi概念股之后,市場又一“最靚的仔”。
在資本市場中,目前已有多家A股公司在公告及互動平臺回應了與豆包的合作情況。
比如,近期,字節(jié)跳動發(fā)布了首款AI智能體耳機Ola Friend,該款耳機接入字節(jié)跳動旗下豆包大模型,中科藍訊股價一度大幅上漲。12月13日,中科藍訊在公告中表示,公司訊龍三代BT895x芯片可滿足AI耳機端側對語音處理、高速音頻傳輸?shù)鹊男枨?,已被搭載于FIIL GS Links AI高音質開放式耳機,是繼早前上市的Ola Friend耳機外,市場上第二款支持豆包大模型AI的耳機產(chǎn)品。
對于公司與字節(jié)跳動的合作,中科藍訊表示,為滿足市場對于AI耳機日益增大的需求,公司與字節(jié)跳動旗下的云服務平臺火山引擎展開了深度合作。公司訊龍三代BT895x芯片完成了與火山方舟MaaS平臺的對接,已可向用戶提供適配豆包大模型的軟、硬件解決方案。
中科藍訊稱,公司與豆包大模型的合作,將分多階段進行,現(xiàn)階段已經(jīng)適配了實時翻譯、會議紀要、實時對話等功能,后續(xù)雙方將會面對不同的使用場景推出更多的AI功能。未來,公司將持續(xù)布局AI穿戴產(chǎn)品領域,繼續(xù)與豆包大模型深度合作,向市場推出用戶體驗度更好的AI穿戴解決方案。
南凌科技近期的投關活動中,有投資者詢問公司與字節(jié)跳動火山引擎、豆包AI合作的細節(jié)。南凌科技在12月13日披露的公告中提到,公司與火山引擎在多個領域開展了合作,南凌科技是火山引擎全線產(chǎn)品的代理商。
12月13日,有投資者詢問德生科技是否與豆包大語言模型有合作,德生科技在互動平臺回應稱,公司自研的行業(yè)大模型在通用知識方面,有使用上述的大語言模型,目前反饋量不大,會隨著場景需求來變化。
洲明科技也在互動平臺表示,公司在自研UniAvatar數(shù)字人系統(tǒng)上,與微軟、騰訊、百度、科大訊飛、字節(jié)火山和豆包等展開合作。其中2024年5月,洲明數(shù)字人接入火山引擎的TTS能力和豆包的大模型問答能力,適用于數(shù)字人對話系統(tǒng)等應用場景。
蜂助手表示,公司與字節(jié)跳動旗下的豆包就智能設備領域進行初步洽談,但目前尚未向市場推出相關產(chǎn)品。
抖音豆包概念股公司,也迅速成為機構調研的對象。近期,獲得機構密集調研的豆包概念股公司包括中科藍訊、樂鑫科技、中科創(chuàng)達、海天瑞聲等。
不過也有一些市場傳言的合作并不真實。
典型的是“豆包”大模型與中興手機合作。這一消息一度引發(fā)中興通訊股價大漲。不過,很快,豆包相關負責人回應表示,消息不實?!岸拱贝竽P鸵呀?jīng)和許多手機有了深度合作,但并沒有和中興通訊探討過成立新品牌可能性,芯片也沒有相關的合作。
霧里看花之間,哪些才是豆包真正的合作伙伴呢?
在大會現(xiàn)場,e記者也看到火山引擎生態(tài)與合作伙伴列表。在列表中的企業(yè)主體,與字節(jié)跳動大模型的合作更有“含真量”和“含金量”。
校對:廖勝超