ChatGPT新功能可以「讓AI主動做事」執行長:非常震撼
2025/07/18 13:03:11文/品觀點綜合編輯
美國科技公司OpenAI於7月18日凌晨舉行直播活動,正式發布通用人工智能代理ChatGPT Agent。這款全新AI智能體融合了Operator、Deep Research和ChatGPT三大模組的優勢,具備自主思考和行動的能力,能夠主動從其技能庫中選擇合適的工具來完成各種超複雜任務。
ChatGPT Agent配備了多種網絡工具,包括可視化瀏覽器、文本瀏覽器和直接API訪問權限。它通過虛擬計算機處理任務,能夠流暢地在推理與執行之間切換,不僅能進行邏輯推理,還能實際執行任務,從而獨立完成複雜的多步驟任務。
在功能方面,ChatGPT Agent可以通過互聯網搜索或API獲取數據,進行深入的財務研究、製作精美的幻燈片,或者預定活動和規劃行程。值得注意的是,在內部基準測試中,ChatGPT Agent展現出處理入門級投資銀行分析師(1-3年工作經驗)任務的能力,例如為財富500強公司構建符合準則的財務報表模型,或為私有化交易構建槓桿收購模型。
OpenAI在演示中展示了ChatGPT Agent的實際應用。例如,根據結婚請柬上的日期、地點和著裝要求,搜索合適的男裝和鞋子,並推薦禮物。另一個案例是根據美國職業棒球大聯盟賽程,規劃一條在2025賽季常規賽期間,走遍全美30座大聯盟棒球隊的觀賽路線,推薦酒店住宿,最後以電子表格的形式呈現並生成一張可視化路線圖。
在安全性方面,ChatGPT Agent的設計充分考慮了用戶的安全需求。在執行涉及敏感或重要操作前,ChatGPT會明確徵得用戶的授權,確保用戶始終掌握控制權。此外,ChatGPT Agent還具備主動監督和風險緩解功能,能夠主動拒絕高風險任務,例如金融交易或敏感法律互動。
根據OpenAI公布的測試數據,ChatGPT Agent在多項測試中表現優異。在"人類終極考試"中,單次嘗試通過率達41.6%,採用並行策略時分數提升至44.4%。在"前沿數學"基準中,準確率達27.4%,大幅超越以往模型。在BrowseComp基準中以68.9%的成績創下新紀錄,比深度研究高17.4%。
ChatGPT Agent即日起向ChatGPT Plus、Pro和Team付費用戶開放,預計今夏稍晚擴展至企業與教育用戶。用戶可直接從"工具"選單中啟用。雖然有外媒指出ChatGPT Agent的執行速度仍偏慢,但OpenAI強調,該工具更專注於處理困難任務,即使過程花上15分鐘或半小時,也比人工完成來得高效。
隨著ChatGPT Agent的推出,AI技術再次向前邁進了一大步,為未來人工智能的發展開闢了新的可能性。然而,這項技術的廣泛應用也將帶來諸多挑戰和機遇,值得我們持續關注和探討。