界面新聞記者 | 伍洋宇
界面新聞編輯 | 文姝琪
從不久前Manus刷屏互聯網開始,就不斷有聲音議論智譜AI的Agent會如何選擇下一個迭代方向。
在此之前,智譜AI是國內第一家押注并發力AI Agent的“AI六小虎”,其AutoGLM也憑借“人類歷史上第一個AI發出的紅包”獲得了一波熱度。
再次舉辦發布會,智譜的確把重心放在了AI Agent上。3月31日,智譜AI在2025中關村論壇上正式發布“AutoGLM沉思”,同時具備深度研究能力(Deep Research)和實際操作(Operator),可自主打開并瀏覽網頁,完成從數據檢索、分析到生成報告。
簡而言之,AutoGLM沉思約等于AutoGLM與Deep Research的結合。
Deep Research起初是由谷歌在去年底上線,但這項“Gemini with Deep Research”功能受限于Gemini當時的模型能力,并沒有發揮出最好功效,反倒由OpenAI隨后推出的Deep Research奪走了用戶的關注與支持。
盡管OpenAI只向收費200美元/月的ChatGPT Pro用戶開放,但在o1、o3等模型支持下,Deep Research仍然迅速成為了這個付費模式下的核心產品。
智譜AutoGLM沉思是國內第一個跟進深度研究能力的Agent產品,并且做到了免費、不限量。在演示視頻中,它展示了在法律、教育、金融等領域的自主操作、研究及報告生成能力。
遇到模型的知識盲區時,該Agent除了搜索網頁,也會自主打開瀏覽器等頁面,基于GUI(Graphical User Interface,圖形用戶界面)閱讀能力在小紅書等內容App讀取信息。
在模型底座上,智譜表示,AutoGLM沉思接入了智譜推理模型GLM-Z1-Air和基座模型GLM-4-Air0414。其中,GLM-Z1-Air性能對標DeepSeek-R1,速度最高可提升8倍,價格為后者的1/30。
具體技術演進路徑方面,智譜表示AutoGLM沉思經過了“GLM-4基座模型-GLM-Z1推理模型-GLM-Z1-Rumination沉思模型-AutoGLM模型”。其中核心鏈路的模型和技術,智譜稱將于4月14日正式開源,并于近期陸續上線。
需要指出的是,智譜當前十分強調AutoGLM沉思的初階屬性。不僅是智譜AI CEO張鵬在現場表示這是一個預覽版本,核心支持Research場景。智譜AI AutoGLM技術負責人劉瀟在介紹產品時,也指出其現階段產品還有諸多不足,并在演示視頻中表示它是在“Entry Level(入門級別)”處理很多繁雜的任務。
在功能實現上,它與OpenAI的Deep Research也確實存在差距。例如,在實測中,當AutoGLM沉思處于生成任務狀態時,它無法進行多窗口對話,以及在任務發布階段,它不會像OpenAI一樣對用戶進行反向詢問,以豐富研究框架并界定結論邊界。
這意味著AutoGLM沉思在產品功能層面還有更多優化空間。
不過,張鵬此次強調了智譜對于AI Agent的重視與信心。“智譜很早便布局AI Agent,甚至早過OpenAI和Anthropic。”張鵬說,智譜率先提出了Phone use(AutoGLM),也幾乎與Anthropic在同一時間發布了Computer use。
在演進方向上,張鵬從技術角度指出,不僅是模型訓練存在Scaling Law(規模法則),Agent也存在類似法則。“通過擴展訓練時的 inference compute(推理時計算),我們觀察到Agent展現出了更強的性能。”
他解釋稱,這背后是其自進化在線課程強化學習算法框架WebRL,通過設計由易到難的任務序列,逐步引導模型從簡單場景向復雜場景過渡學習,從而提升訓練效率和最終性能。
該方法模擬人類學習過程,通過動態調整任務難度,幫助模型積累基礎能力后再挑戰高難度任務,可以避免直接處理復雜問題時的訓練不穩定。
“2025年將會是Agent應用的元年,智譜也將深度參與這一場浪潮。”張鵬說。
目前來看,綜合已有模型性能水平、研究實力、產品化能力等多方面因素,智譜是當前國內在AI Agent領域跑在前列的創業公司之一。但Manus效應在前,在外接非自研模型的基礎上,出色的產品設計及工程化能力也可能創造出驚艷的產品效果,這或許是智譜AutoGLM接下來面臨的最大挑戰。