3月31日,智譜在中關(guān)村論壇上正式發(fā)布AutoGLM沉思。作為智譜的全新智能體,AutoGLM沉思不僅具備深度研究能力(Deep Research),還能實現(xiàn)實際操作(Operator),推動AI Agent(智能體)進入“邊想邊干”的階段。
支持一邊推理一邊搜索,完成復雜任務(wù)的“神器”
據(jù)智譜介紹,之所以取名為AutoGLM沉思,是因為AutoGLM 沉思背后的模型,是全新推出的沉思模型,即通過強化學習,讓模型學會自我批評、反思、甚至沉思,并通過更長的深度思考時間換取更優(yōu)的效果。沉思突破了實時聯(lián)網(wǎng)搜索、動態(tài)工具調(diào)用、深度分析和自我驗證,實現(xiàn)真正的長程推理和任務(wù)執(zhí)行。
和其他智能體相比,AutoGLM沉思能夠模擬人的思考,尤其是像人一樣的深度研究和反思;能夠像人一樣感知這個世界;能夠像人一樣使用工具。因此,沉思功能能夠回應(yīng)開放式的復雜問題,通過一邊推理,一邊搜索,瀏覽數(shù)十甚至上百個網(wǎng)頁,總結(jié)出條理清晰的長文報告,并提供所有引用來源,讓AI輸出的內(nèi)容切實可查。
目前,AutoGLM沉思在智譜清言PC客戶端上線,用戶可免費體驗其研究能力和操作能力。根據(jù)官方指引,下載并安裝智譜清言桌面客戶端并在最新版本的Chrome瀏覽器中安裝智譜清言瀏覽器插件后,進入AutoGLM沉思智能體發(fā)起指令,并可讓其協(xié)助完成一系列復雜任務(wù)。
比如在具身智能行業(yè)研究任務(wù)中,向AutoGLM沉思智能體發(fā)布“請挖掘當前 A 股市場中與具身智能相關(guān)的熱點主題。搜集最近三個月內(nèi)的實時行業(yè)新聞、公開數(shù)據(jù)、權(quán)威報道和專家評論,結(jié)合關(guān)鍵財務(wù)和經(jīng)營指標進行量化分析,形成一份主題投資深度研報,包括趨勢預(yù)測、競爭格局、投資策略和風險分析”的指令后,AutoGLM 沉思智能體將一邊搜索,一邊像人類一樣用Chrome瀏覽器打開并瀏覽網(wǎng)頁,不僅包括多家財經(jīng)網(wǎng)站的公開報道,還有券商研報、知乎文章等,全程行云流水地完成數(shù)據(jù)檢索、分析、生成報告等任務(wù)。
目前,沉思功能已經(jīng)正式上線智譜清言網(wǎng)頁端、PC端和手機 App,免費、不限量地開放使用。這也是國內(nèi)首個正式開放的Deep Research功能。
基于自主研發(fā)的全棧大模型技術(shù),即將開源
AutoGLM沉思的背后,是智譜自主研發(fā)的全棧大模型技術(shù),融合了GLM-4的通用能力、GLM-Z1的反思能力、GLM-Z1-Rumination的沉思能力,以及AutoGLM的自動執(zhí)行能力。
據(jù)介紹,AutoGLM沉思的技術(shù)演進路徑包括:GLM-4基座模型 → GLM-Z1推理模型 → GLM-Z1-Rumination沉思模型 → AutoGLM模型。其中核心鏈路的模型和技術(shù),將于4月14日正式開源,以推動行業(yè)生態(tài)發(fā)展。
首先,在基座模型方面,基于最新技術(shù)積累,智譜重新訓練了一個320億參數(shù)的基座模型GLM-4-Air-0414,在預(yù)訓練階段加入了更多的代碼類、推理類數(shù)據(jù),并在對齊階段針對智能體能力進行了優(yōu)化,模型在工具調(diào)用、聯(lián)網(wǎng)搜索、代碼等智能體任務(wù)上的能力得到大大加強。
GLM-4-Air-0414以32B參數(shù)量比肩更大參數(shù)量的國內(nèi)外主流模型,這使得模型在適配智能體任務(wù)方面特別有效。這是因為智能體任務(wù)往往涉及多輪復雜交互,32B的參數(shù)量使得 GLM-4-Air-0414 能快速執(zhí)行復雜任務(wù),為 AI 智能體的真正大規(guī)模落地應(yīng)用提供了堅實基礎(chǔ)。
其次,在推理模型方面,基于GLM-4-Air-0414,智譜引入了更多推理類數(shù)據(jù),并在對齊階段深度優(yōu)化了通用能力,推出了全新的深度思考模型GLM-Z1-Air。在性能表現(xiàn)上,GLM-Z1-Air可以與DeepSeek-R1(671B,激活37B)媲美。在AIME 24/25、LiveCodeBench、GPQA等基準測試中,GLM-Z1-Air展現(xiàn)了較為強大的數(shù)理推理能力,為更多復雜任務(wù)的解決提供了支持。
再次,在沉思模型方面,智譜基于GLM-Z1,通過擴展強化學習訓練,提升了模型結(jié)合工具使用完成長程推理能力,訓練出沉思模型GLM-Z1-Rumination。該模型突破了傳統(tǒng)AI單純依賴內(nèi)部知識推理的局限,創(chuàng)新性地結(jié)合實時聯(lián)網(wǎng)搜索、動態(tài)工具調(diào)用、深度分析和自我驗證,形成“實時搜索—深度分析—動態(tài)驗證”的完整自主研究流程。
最后,在AutoGLM模型方面,在斯坦福大模型中心《AI指數(shù)2024》選定的智能體基準評測AgentBench上,智譜AutoGLM系列模型在5個測試環(huán)境中也取得了SOTA(State-Of-The-Art,是指在某一領(lǐng)域或任務(wù)中,某個模型或方法達到了當前最優(yōu)的性能水平)的成績。在GUI智能體領(lǐng)域,智譜自研模型GLM-PC(CogAgent)在多個權(quán)威評測榜單上取得SOTA成績。憑借僅9B的參數(shù),CogAgent超越了包括GPT-4o + UGround、Claude Computer Use等更大規(guī)模的同類模型或商用API。
推動智能體在各地各領(lǐng)域的廣泛應(yīng)用
2025年被視為AI Agent的爆發(fā)之年。記者了解到,智譜押注智能體作為下一個技術(shù)爆發(fā)點,并將戰(zhàn)略聚焦Agentic GLM的研發(fā),以推動智能體技術(shù)的快速發(fā)展。
在技術(shù)方面,智譜將依托原創(chuàng)自主大模型技術(shù),持續(xù)推動具備邏輯推理和深度思考能力的Agent基座模型與通用基座模型的研發(fā),再到智能體框架與Agent應(yīng)用,朝著讓機器像人一樣思考和行動的目標不斷前進。
智譜還將搭建Agentic LLM平臺,助力生態(tài)合作伙伴利用智譜模型與智能體的強大能力,構(gòu)建行業(yè)、地域與場景深度融合的智能體應(yīng)用。
在行業(yè)生態(tài)方面,智譜將作為模型廠商,始終致力于幫助應(yīng)用合作伙伴在GLM模型上實現(xiàn)成功的大模型應(yīng)用。目前,智譜已與金融、教育、醫(yī)療、政務(wù)、企服等領(lǐng)域的合作伙伴,共同推進Agentic LLM的落地應(yīng)用。區(qū)域合作方面,智譜也相繼與北京、杭州、上海、成都、珠海等城市達成合作,與當?shù)佚堫^企業(yè)攜手推動當?shù)卮竽P蛻?yīng)用生態(tài)的建設(shè)。
此外,智譜積極推動中國原創(chuàng)大模型及解決方案出海,幫助共建“一帶一路”國家構(gòu)建自主、可控、無幻覺的國家級/區(qū)域級的自主大模型。由智譜主導,來自東盟十國及共建“一帶一路”的10個國家共同發(fā)起的“自主大模型國際共建聯(lián)盟”正式成立,幫助共建“一帶一路”國家建立自主AI,構(gòu)建可控的國家級AI基礎(chǔ)設(shè)施。
校對:蘇煥文