什麼使一個 AI 系統成為「代理人」?

AI

簡單來說,AI 代理人是一種能夠「感知環境並採取行動以達成特定目標」的系統。它是大型語言模型(LLM)的進化版本,擁有規劃、使用工具、以及與周遭環境互動的能力。可以把「代理型 AI」想像成一個能在工作中持續學習的智慧助理。它遵循一個簡單的五步驟循環來完成任務(見圖1):

  1. 接收任務:你給它一個目標,例如「幫我整理行程」。

  2. 掃描場景:它收集必要資訊——閱讀郵件、檢查行事曆、存取聯絡人——來理解情境。

  3. 思考規劃:它設計行動計畫,思考最佳的方式達成目標。

  4. 執行任務:它依計劃行動,例如發送邀請、安排會議、更新行事曆。

  5. 學習精進:它觀察結果並調整。例如,如果會議被改期,它會學習並改善未來的排程策略。

圖1:代理型 AI 就像智慧助理,透過經驗不斷學習。它依循五步驟循環完成任務。


為什麼「代理人」正在崛起?

AI 代理人正以驚人的速度普及。根據近期研究,多數大型 IT 公司正在積極使用代理人,且有五分之一是在過去一年內才開始使用。金融市場也注意到這一趨勢:截至 2024 年底,AI 代理人新創公司已募資超過 20 億美元,市場價值達 52 億美元,並預期在 2034 年將爆發性成長到近 2000 億美元。

短短兩年內,AI 的典範轉移已經非常劇烈,從單純的自動化邁向高度自主的系統(見圖2)。最初的工作流程依賴基本的提示與觸發,利用 LLM 處理資料;隨後發展為 RAG(檢索增強生成),透過真實資料提升可靠性;接著進化到能夠使用各種工具的獨立 AI 代理人;如今,我們正進入「代理型 AI」的時代:一群專門的代理人能協作來完成複雜目標,這是 AI 協作能力的一大飛躍。

圖2:從 LLM 到 RAG,再到 Agentic RAG,最終到代理型 AI 的演進過程。


代理人複雜度的不同層級(見圖3)

 

等級 0:核心推理引擎
LLM 本身不是代理人,但可以作為最基本代理系統的推理核心。在這個「Level 0」架構中,LLM 不使用工具、沒有記憶,也不與環境互動,它僅依賴訓練知識回應問題。它的優勢是解釋既有概念,但缺點是無法得知即時事件。例如,它無法回答「2025 奧斯卡最佳影片得主」這種超出訓練數據範圍的問題。

等級 1:連接型問題解決者
在這個層級,LLM 透過連接外部工具成為功能性代理人。它不再侷限於既有知識,而是能透過一連串行動來蒐集與處理資訊。例如,它能使用搜尋工具查找最新影集,或透過財經 API 取得 AAPL 股票即時價格。能夠與外界互動、跨多步驟解決問題,正是 Level 1 代理人的核心能力。

等級 2:策略型問題解決者
這一層級的代理人具備更高的能力,包括戰略規劃、主動協助與自我改進。其關鍵技能是 提示工程與情境工程(context engineering)
舉例來說:若要找出兩個地點之間的咖啡廳,代理人會先使用地圖工具,再將輸出的資料(例如街道名稱)簡化並餵入本地搜尋工具,避免資訊過載。這種「提煉最關鍵資訊」的能力,確保模型高效又準確地執行任務。
在軟體工程中,代理人可以讀取 bug 報告、存取程式碼庫,再透過情境工程將大量資訊濃縮成精簡上下文,讓它能有效率地寫出、測試並提交正確的程式修補。

等級 3:協作型多代理系統的崛起
這是 AI 發展的重要轉折點:從追求「單一超級代理人」轉向「多代理協作系統」。就像人類組織裡的部門分工,不同的專門代理人各自承擔角色,透過協作解決複雜挑戰。
例如,新產品上市的流程:一個「專案經理代理人」協調全局,並委派「市場研究代理人」、「產品設計代理人」、「行銷代理人」分別負責工作。其成功關鍵在於代理人間無縫的資訊交換與協作。


代理人未來的五大假設(見圖4)

  1. 通才型代理人的出現
    未來的代理人可能從專才進化為能處理模糊、長期目標的「通才」。例如:「規劃我公司下季 30 人的里斯本員工旅遊」,代理人能連續數週管理專案,包括預算、航班、場地、行程,並提供更新。另一條路徑是「小語言模型(SLM)」:用小型、專門代理人組裝系統,就像樂高積木般靈活。

  2. 深度個人化與主動目標發現
    代理人將不再只是執行指令,而是成為「主動夥伴」。它能從你的行為模式學習,並在確信有幫助時主動提出建議。例如,如果你對綠能有興趣,它可能主動幫你蒐集課程或研究摘要。

  3. 具身化與物理世界互動
    代理人將進入實體世界,與機器人結合,成為「具身代理人」。例如,不只是幫你叫水電工,而是直接自己修好漏水的水龍頭。這將徹底改變製造、物流、居家照護等領域。

  4. 代理人驅動的經濟
    未來,代理人可能成為經濟體中的獨立角色,創造新市場與商業模式。例如,一個代理人能自主經營電商事業,從產品選品、行銷內容、生產鏈管理到動態定價,全面自動化。

  5. 目標驅動、可變形的多代理系統
    未來的系統將不再依賴明確程式設計,而是根據「目標」自我組織。用戶只需下達目標,例如「建立一個成功的精品咖啡電商品牌」,系統就會自動生成合適的代理人團隊,並動態調整架構:新增、刪除或複製代理人,直到達成任務。


結論

AI 代理人是從傳統模型進化而來的自主系統,能感知、規劃、執行以實現目標。這項技術正從單一代理人使用工具,發展到多代理協作,能解決多面向的挑戰。未來的發展可能包括:通才型代理人、深度個人化、具身化代理人,以及參與經濟活動的代理人。這標誌著一個重大典範轉移:走向自我改進、以目標為導向的系統,將有潛力自動化整個工作流程,並徹底改變我們與科技的關係。

參考資料: