智能體概念股午后大漲。
3月31日,智譜在中關村論壇上正式發(fā)布AutoGLM沉思。作為智譜的全新智能體,AutoGLM沉思不僅具備深度研究能力(DeepResearch),還能實現(xiàn)實際操作(Operator),推動AIAgent(智能體)進入“邊想邊干”的階段。
據(jù)了解,AutoGLM沉思基于智譜自主研發(fā)的全棧大模型技術,其中核心鏈路的模型和技術將于4月14日正式開源,以推動行業(yè)生態(tài)發(fā)展。目前,沉思功能已經(jīng)正式上線智譜清言網(wǎng)頁端、PC端和手機App,免費、不限量地開放使用。這也是國內首個正式開放的DeepResearch功能。
受AutoGLM沉思影響,AI智能體概念午后出現(xiàn)異動,截至發(fā)稿,宏景科技、賽意信息20%漲停,致遠互聯(lián)漲超8%,開普云漲超7%,新開普、新致軟件漲超6%,鼎捷數(shù)智漲超5%。
支持一邊推理一邊搜索,完成復雜任務的“神器”
據(jù)智譜介紹,之所以取名為AutoGLM沉思,是因為AutoGLM沉思背后的模型,是全新推出的沉思模型,即通過強化學習,讓模型學會自我批評、反思、甚至沉思,并通過更長的深度思考時間換取更優(yōu)的效果。沉思突破了實時聯(lián)網(wǎng)搜索、動態(tài)工具調用、深度分析和自我驗證,實現(xiàn)真正的長程推理和任務執(zhí)行。
和其他智能體相比,AutoGLM沉思能夠模擬人的思考,尤其是像人一樣的深度研究和反思;能夠像人一樣感知這個世界;能夠像人一樣使用工具。因此,沉思功能能夠回應開放式的復雜問題,通過一邊推理一邊搜索,瀏覽數(shù)十甚至上百個網(wǎng)頁,總結出調理清晰的長文報告,并提供所有引用來源,讓AI輸出的內容切實可查。
目前,AutoGLM沉思在智譜清言PC客戶端上線,用戶可免費體驗其研究能力和操作能力。根據(jù)官方指引,下載并安裝智譜清言桌面客戶端并在最新版本的Chrome瀏覽器中安裝智譜清言瀏覽器插件后,進入AutoGLM沉思智能體發(fā)起指令,并可讓其協(xié)助完成一系列復雜任務。
比如在具身智能行業(yè)研究任務中,向AutoGLM沉思智能體發(fā)布“請挖掘當前A股市場中與具身智能相關的熱點主題。搜集最近三個月內的實時行業(yè)新聞、公開數(shù)據(jù)、權威報道和專家評論,結合關鍵財務和經(jīng)營指標進行量化分析,形成一份主題投資深度研報,包括趨勢預測、競爭格局、投資策略和風險分析”的指令后,AutoGLM沉思智能體將一邊搜索,一邊像人類一樣用Chrome瀏覽器打開并瀏覽網(wǎng)頁,不僅包括多家財經(jīng)網(wǎng)站的公開報道,還有券商研報、知乎文章等,全程行云流水地完成數(shù)據(jù)檢索、分析、生成報告等任務。
目前,沉思功能已經(jīng)正式上線智譜清言網(wǎng)頁端、PC端和手機App,免費、不限量地開放使用。這也是國內首個正式開放的DeepResearch功能。
基于自主研發(fā)的全棧大模型技術,即將開源
AutoGLM沉思的背后,是智譜自主研發(fā)的全棧大模型技術,融合了GLM-4的通用能力、GLM-Z1的反思能力、GLM-Z1-Rumination的沉思能力,以及AutoGLM的自動執(zhí)行能力。
據(jù)介紹,AutoGLM沉思的技術演進路徑包括:GLM-4基座模型→ GLM-Z1推理模型→ GLM-Z1-Rumination沉思模型→ AutoGLM模型。其中核心鏈路的模型和技術,將于4月14日正式開源,以推動行業(yè)生態(tài)發(fā)展。
首先,在基座模型方面,基于最新技術積累,智譜重新訓練了一個320億參數(shù)的基座模型GLM-4-Air-0414,在預訓練階段加入了更多的代碼類、推理類數(shù)據(jù),并在對齊階段針對智能體能力進行了優(yōu)化,模型在工具調用、聯(lián)網(wǎng)搜索、代碼等智能體任務上的能力得到大大加強。
GLM-4-Air-0414以32B參數(shù)量比肩更大參數(shù)量的國內外主流模型,這使得模型在適配智能體任務方面特別有效。這是因為智能體任務往往涉及多輪復雜交互,32B的參數(shù)量使得GLM-4-Air-0414能快速執(zhí)行復雜任務,為AI智能體的真正大規(guī)模落地應用提供了堅實基礎。
其次,在推理模型方面,基于GLM-4-Air-0414,智譜引入了更多推理類數(shù)據(jù),并在對齊階段深度優(yōu)化了通用能力,推出了全新的深度思考模型GLM-Z1-Air。在性能表現(xiàn)上,GLM-Z1-Air可以與DeepSeek-R1(671B,激活37B)媲美。在AIME24/25、LiveCodeBench、GPQA等基準測試中,GLM-Z1-Air展現(xiàn)了較為強大的數(shù)理推理能力,為更多復雜任務的解決提供了支持。
再次,在沉思模型方面,智譜基于GLM-Z1,通過擴展強化學習訓練,提升了模型結合工具使用完成長程推理能力,訓練出沉思模型GLM-Z1-Rumination。該模型突破了傳統(tǒng)AI單純依賴內部知識推理的局限,創(chuàng)新性地結合實時聯(lián)網(wǎng)搜索、動態(tài)工具調用、深度分析和自我驗證,形成“實時搜索—深度分析—動態(tài)驗證”的完整自主研究流程。
最后,在AutoGLM模型方面,在斯坦福大模型中心《AI指數(shù)2024》選定的智能體基準評測AgentBench上,智譜AutoGLM系列模型在5個測試環(huán)境中也取得了SOTA(State-Of-The-Art,是指在某一領域或任務中,某個模型或方法達到了當前最優(yōu)的性能水平)的成績。在GUI智能體領域,智譜自研模型GLM-PC(CogAgent)在多個權威評測榜單上取得SOTA成績。憑借僅9B的參數(shù),CogAgent超越了包括GPT-4o+ UGround、ClaudeComputer Use等更大規(guī)模的同類模型或商用API。
推動智能體在各地各領域的大規(guī)模應用
受AutoGLM沉思影響,AI智能體概念出現(xiàn)異動,截至發(fā)稿,宏景科技、賽意信息20%漲停,致遠互聯(lián)漲超8%,開普云漲超7%,新開普、新致軟件漲超6%,鼎捷數(shù)智漲超5%。
2025年被視為AIAgent的爆發(fā)之年。記者了解到,智譜押注智能體作為下一個技術爆發(fā)點,并將戰(zhàn)略聚焦AgenticGLM的研發(fā),以推動智能體技術的快速發(fā)展。
在技術方面,智譜將依托原創(chuàng)自主大模型技術,持續(xù)推動具備邏輯推理和深度思考能力的Agent基座模型與通用基座模型的研發(fā),再到智能體框架與Agent應用,朝著讓機器像人一樣思考和行動的目標不斷前進。
智譜還將搭建AgenticLLM平臺,助力生態(tài)合作伙伴利用智譜模型與智能體的強大能力,構建行業(yè)、地域與場景深度融合的智能體應用。
在行業(yè)生態(tài)方面,智譜將作為模型廠商,始終致力于幫助應用合作伙伴在GLM模型上實現(xiàn)成功的大模型應用。目前,智譜已攜手金融、教育、醫(yī)療、政務、企服等領域的合作伙伴,共同推進AgenticLLM的落地應用。區(qū)域合作方面,智譜也相繼與北京、杭州、上海、成都、珠海等城市達成合作,與當?shù)佚堫^企業(yè)攜手推動當?shù)卮竽P蛻蒙鷳B(tài)的建設。
申萬宏源研報指出,智譜AutoGLM內測的整體效果較好,AIAgent已可以較為智能地完成用戶日常使用中的眾多操作,具備一定的實用性,有望成為AI在C端硬件側落地的重要產(chǎn)品,拉開國內AIAgent快速進步的序幕。
校對:冉燕青
(點擊圖片進入報名頁面)