
前言:為什麼要認識這兩款 AI 代理?
近年「個人 AI 代理(AI Agent)」越來越熱門,許多人都想擁有一個能幫自己處理雜事、串接各種工具的 AI 小助手。在開源世界裡,OpenClaw 與 Hermes Agent 是兩個非常具代表性的選擇。
雖然它們都是「開源的個人 AI 代理」,但骨子裡的設計哲學其實完全不同:
💡 一句話看懂差異:
OpenClaw:像是一座「廣泛整合的中央控制塔」,什麼平台都能接、什麼技能都能裝。
Hermes Agent:像是一個「會自我學習、越用越聰明的迴圈」,重點在持續進化。
接下來我們用 5 個面向,帶你一步步看懂兩者的差異。
1. 核心編排引擎:控制塔 vs 學習迴圈
「編排引擎」可以想成 AI 代理的「大腦運作方式」。
🏰 OpenClaw:閘道控制面架構
- 用 TypeScript / Node.js 開發。
- 系統中心是一個叫做 Gateway(閘道器) 的控制塔。
- 所有訊息(據說可接入 超過 50 種通訊平台)都會先流進這座控制塔,再由 ReAct 迴圈 決定怎麼回應、要呼叫哪個工具。
比喻:像機場塔台,所有飛機(訊息)起降都要經過它統一調度。
🔄 Hermes Agent:學習迴圈架構
- 用 Python 開發。
- 核心是一個「執行 → 學習 → 改善(do, learn, improve)」的閉環迴圈。
- 通訊、排程、工具執行、甚至 強化學習(RL) 環境,都圍繞著這個迴圈運作。
比喻:像健身教練,每次訓練後都會檢討、調整菜單,讓你下次表現更好。
2. 記憶系統:檔案櫃 vs 多層大腦
AI 代理要記得你是誰、你喜歡什麼,就需要「記憶系統」。
📁 OpenClaw:靜態 Markdown + SQLite
採用人類易讀的扁平檔案記憶:
| 檔案 | 用途 |
|---|---|
SOUL.md |
定義 AI 的人格與限制 |
MEMORY.md |
儲存筆記與長期記憶 |
USER.md |
記錄使用者偏好 |
再搭配 SQLite 做檢索。優點是透明、好除錯,你隨時打開檔案就能看到 AI 記得什麼。
🧠 Hermes Agent:四層動態記憶系統
比較像「人腦」的分層設計:
- 會話歷史:這次對話在講什麼。
- 動態使用者建模:基於 Honcho 系統,跨會話持續描繪你的決策與偏好。
- FTS5 全文檢索 + LLM 摘要:快速撈出過去的相關資訊。
- 程序性記憶(技能庫):記得「怎麼做事」的經驗。
好處:能區分熱資料與冷資料,省 Token、也不會讓上下文爆掉。
3. 技能管理:說明書助手 vs 自學徒弟
「技能(Skills)」決定 AI 能做什麼事。
📖 OpenClaw:人類編寫、靜態執行
- 依靠社群中心 ClawHub,上面有 超過 13,000 個 由開發者寫好的靜態技能。
- 技能不會自己變,第 1 天跟第 100 天執行方式一模一樣。
- 適合喜歡「裝外掛」的使用者。
🎓 Hermes Agent:自主生成、動態優化
- 具備 程序性記憶(Procedural Memory)。
- 大約每執行 15 次任務,後台評審機制就會自動檢討結果。
- 把成功的推理模式、或你的修正偏好,萃取成可重複使用的新技能。
結果:用得越久,它越懂你,也越來越聰明。
4. 執行環境與沙盒:本機運行 vs 多後端隔離
這關係到 AI 在哪裡執行程式,以及會不會「搞砸你的電腦」。
💻 OpenClaw
- 主要跑在 本機(Local) 或 Docker。
- 原生架構缺乏嚴格的安全限制,主要靠底層 LLM 自己把關,或加上**人機協作(HITL)**防禦層。
🏗️ Hermes Agent
支援 6 種執行後端,彈性非常高:
- Local
- Docker(強制唯讀根目錄)
- SSH
- Daytona
- Singularity
- Modal(Serverless 無伺服器架構,閒置時成本幾乎為零)
並且將工具調用嚴格隔離在沙盒裡,降低風險。
5. 安全性架構:自行把關 vs 預設保守
安全性對 AI 代理非常重要,畢竟它能幫你「動手做事」。
⚠️ OpenClaw
- 因為社群技能來源廣泛,曾爆出多個嚴重 CVE 漏洞(包含 Token 外洩、遠端代碼執行等)。
- 使用者需要自行審查第三方技能、並確保系統即時更新。
🛡️ Hermes Agent
採 「預設保守(conservative-by-default)」 策略,內建 Tirith 安全模組:
- 主動掃描提示詞注入攻擊
- 自動過濾憑證外洩風險
- 直接 hard block(硬性阻擋) 高風險指令,例如
curl | sh - 不給使用者點「我同意」繞過的機會
一張表快速比較
| 比較面向 | OpenClaw 🏰 | Hermes Agent 🔄 |
|---|---|---|
| 開發語言 | TypeScript / Node.js | Python |
| 核心架構 | 中央閘道器控制塔 | 執行-學習-改善迴圈 |
| 記憶系統 | Markdown + SQLite(扁平) | 四層動態記憶(含 Honcho) |
| 技能來源 | ClawHub 13,000+ 人類編寫 | AI 自動萃取並優化 |
| 執行環境 | Local / Docker | 6 種後端(含 Serverless) |
| 安全策略 | 依賴使用者審查 | Tirith 預設保守,硬性阻擋 |
| 適合誰 | 喜歡自由裝外掛、自己把關 | 想要安全、會進化的 AI 助理 |
結語:你該怎麼選?
🧭 - 如果你是 喜歡 DIY、喜歡裝大量外掛、願意自己審查技能 的進階玩家 → OpenClaw 會給你極大的自由度。
- 如果你更在意 安全性、長期學習能力、希望 AI 越用越懂你 → Hermes Agent 會是比較貼心的選擇。
兩者都是優秀的開源專案,沒有絕對的好壞。理解它們的設計哲學,才能挑到最適合自己的那一款 AI 代理 💪