11月22日,由粵港澳大灣區(qū)數(shù)字經(jīng)濟研究院(International Digital Economy Academy,簡稱IDEA研究院)主辦的2024年IDEA大會在深圳成功舉行。
IDEA研究院創(chuàng)院理事長、美國國家工程院外籍院士沈向洋在主題演講中指出,在技術大爆發(fā)時期開展創(chuàng)新,對技術的深度理解尤為重要。與此同時,他強調,隨著AI的各項能力逼近甚至超越人類,AI治理已成亟待全球共同面對的議題。
IDEA研究院創(chuàng)院理事長、美國國家工程院外籍院士沈向洋
“深圳是一座用迭代軟件的速度迭代硬件的城市。”沈向洋說道。
成長自“創(chuàng)都”深圳,過去一年,IDEA的大灣區(qū)生態(tài)開枝散葉,種下更多創(chuàng)新的種子。除福田實驗室外,IDEA與前海深港合作區(qū)共建IDEA前海創(chuàng)新院,與深圳龍崗區(qū)合作建設IDEA低空經(jīng)濟分院,與橫琴粵澳深度合作區(qū)共建IDEA—橫琴數(shù)字技術及人工智能測評中心。
本次大會,IDEA還公布一系列前沿研究與產(chǎn)業(yè)落地成果,帶來從技術突破到產(chǎn)業(yè)融合的AI盛宴。
從通用視覺感知到具身智能
沈向洋在演講中表示,計算機視覺技術在真實世界的應用場景十分廣泛。然而,過去主流的小模型方案,難以應對碎片化、多變的長尾需求,限制了技術落地規(guī)模。源自自然語言研究的Transformer架構誕生后,視覺模型與之結合,走上一條“從小變大,從N變1”之路。
自2022年起,IDEA團隊從目標檢測出發(fā),打造精準度、通用性、泛化能力兼優(yōu)的DINO系列視覺大模型。本次大會發(fā)布了該系列最新的DINO-X通用視覺大模型,擁有真正的物體級別理解能力,實現(xiàn)開放世界(Open-world)目標檢測。無需用戶提示,直接檢測萬物。
與此同時,IDEA團隊還推出行業(yè)平臺架構,通過一個大模型基座,結合通用識別技術,讓模型不需重新訓練,就可邊用邊學,支撐多種多樣的B端應用需求。
視覺感知是機器與物理世界交互的基礎。全場景視覺感知能力的提升,自然為技術落地拓寬了空間。
而在具身智能領域,IDEA研究院此次便一連宣布三個合作:與騰訊合作,在深圳福田區(qū)、河套深港科技創(chuàng)新合作區(qū)落地建設福田實驗室,聚焦人居環(huán)境具身智能技術;與美團合作,探索無人機視覺智能技術;與比亞迪合作,拓展工業(yè)化機器人智能應用。
從合成數(shù)據(jù)到大模型價值創(chuàng)造
合成大模型能力的涌現(xiàn),離不開互聯(lián)網(wǎng)時代的海量數(shù)據(jù)養(yǎng)料積累,沈向洋還在演講中表達了業(yè)界對合成數(shù)據(jù)的重視。
在這個方向上,IDEA團隊自研了語境圖譜技術,解決過往文本數(shù)據(jù)合成方案的多樣性匱乏等問題。該技術為合成數(shù)據(jù)引入“指導手冊”,以圖譜為綱,指導用于合成的語境采樣。
結果顯示,IDEA團隊的方案能持續(xù)為大模型帶來能力提升,表現(xiàn)超過目前的最佳實踐(SOTA);從token消耗來看,平均節(jié)約成本85.7%。目前,該技術內測平臺已開放,通過API提供服務。
在拓展新前沿的同時,大模型價值創(chuàng)造也在進行時。大會上,IDEA秀出多個垂類行業(yè)應用落地進展,包括:學術大模型和AI科研神器ReadPaper、營銷創(chuàng)作大模型,以及面向經(jīng)濟與金融領域的經(jīng)濟大模型、運籌決策大模型、投資大模型。
從AI for Science到AI for Coding
在基礎研究愈發(fā)受到重視的當下,AI for Science是技術創(chuàng)新創(chuàng)業(yè)的重要方向。今年的諾貝爾獎,更是將這場科學革命推向聚光燈下。
IDEA團隊從化學領域的預測能力和數(shù)據(jù)能力入手,進行了研究和產(chǎn)業(yè)化實踐。
在預測方面,IDEA研發(fā)的多個化學領域專家大模型,分子屬性預測和化學反應預測能力均處業(yè)界領先水平;在數(shù)據(jù)方面,IDEA開發(fā)了化學文獻多模態(tài)大模型,聯(lián)合晶泰科技發(fā)布專利數(shù)據(jù)挖掘平臺PatSight,將藥物領域的專利化合物數(shù)據(jù)挖掘時間,從數(shù)周縮短至1小時。
除了科學研究之外,另一個技術范式正在被AI重塑的領域,是編程語言。
此次大會上,IDEA研究院的MoonBit團隊展示了其開發(fā)平臺強大的AI for coding體驗。
MoonBit是專為云計算與邊緣計算設計的AI云原生編程語言及工具鏈,已具備完備的多后端支持和跨平臺能力,可在硬件上直接運行,支持RISC-V。MoonBit的開源開發(fā)平臺,將于12月正式開放。
低空經(jīng)濟:安全與開放
除了AI外,低空經(jīng)濟成為今年最為引人注目的行業(yè)。
IDEA研究院連續(xù)第三年發(fā)布低空經(jīng)濟白皮書,今年的關鍵詞是安全。沈向洋指出,在低空經(jīng)濟的發(fā)展中,安全是重中之重。唯有實現(xiàn)了安全,才能實現(xiàn)大規(guī)模飛行,而安全,又與效率、成本等要素緊密相聯(lián)。針對此,《低空經(jīng)濟白皮書3.0》推出了低空安全體系。
另一個關鍵詞,則為開放。IDEA推出低空管理與服務操作系統(tǒng)OpenSILAS 1.0 Alpha版,還攜手17家產(chǎn)業(yè)伙伴發(fā)起OpenSILAS創(chuàng)新聯(lián)合體,旨在打造開放共享、技術領先的系統(tǒng)和平臺,建立有實際系統(tǒng)支撐的標準體系。
校對:劉榕枝