
什麼是 OpenCLI?🤔
想像你有一個超強助理,不但能幫你瀏覽網頁、抓取資料,還能直接控制你電腦上的應用程式——這就是 OpenCLI 在做的事!
OpenCLI 是由開發者 jackwener 打造的開源工具,目標很明確:讓任何網站與工具都變成 CLI(命令列介面)。目前在 GitHub 上已累積超過 15,800 顆星 ⭐,是 AI Agent 工具圈的熱門新星。
核心理念:讓 AI Agent 用零 token 成本、確定性地與外部世界互動,成為整個 Agentic 工具鏈的「手與眼睛」。
為什麼新手應該認識 OpenCLI?
如果你剛開始接觸 AI Agent,你一定遇過這個痛點:
- AI 要查資料,得不斷呼叫 API → 花很多 token
- 讓 AI 自己「看」網頁操作 → 慢、不穩定
OpenCLI 的解法是:預先定義好怎麼跟網站溝通,讓 AI 直接下指令就好,不需要每次都靠 LLM 重新理解頁面。快、省錢、穩!
五大核心能力 🚀
1️⃣ 87+ 內建網站 Adapter
OpenCLI 一裝好就支援超多網站,直接拿來用:
| 類別 | 支援平台 |
|---|---|
| 社群媒體 | Twitter/X、Reddit、LinkedIn |
| 中文平台 | Bilibili、小紅書、知乎、閒魚 |
| 學術研究 | arXiv、Stack Overflow |
| 金融資料 | Yahoo Finance、Bloomberg |
| AI 平台 | HuggingFace、Gemini、NotebookLM |
| 電商 | Amazon、1688、閒魚 |
範例指令:
opencli hackernews top --limit 10 --format json
opencli bilibili hot --limit 5
就這樣,一行指令抓資料!🎉
2️⃣ 直接控制桌面 App
OpenCLI 透過 Chrome DevTools Protocol(CDP),可以操控 Cursor IDE、ChatGPT Desktop、Discord、Notion 等 Electron 應用程式:
opencli cursor open /path/to/project
opencli chatgpt ask "解釋 Transformer 架構"
是的,你沒看錯——AI 可以幫你操作 ChatGPT!🤯
3️⃣ 瀏覽器即時控制
opencli browser 指令讓 AI Agent 擁有完整的瀏覽器操控能力:
- 模擬操作:
click、type、select - 擷取狀態:
screenshot、get、state - 進階功能:
network(監聽請求)、eval(執行 JS) - 導覽控制:
scroll、back、wait
4️⃣ AI Agent 原生整合(AGENT.md 標準)
OpenCLI 支援 AGENT.md 標準協議,Claude Code、Cursor Agent 等工具可以自動發現並調用 OpenCLI 的命令。
安裝超簡單:
npx skills add jackwener/opencli
會安裝四個 skill:opencli-usage、opencli-browser、opencli-explorer、opencli-oneshot。
5️⃣ 自動生成新 Adapter
87 個 adapter 不夠用?自己生成一個!
opencli explore https://example.com # 探索頁面結構
opencli synthesize https://example.com # 轉換成 JS adapter
opencli generate https://example.com # 一鍵生成 CLI 命令
opencli cascade https://example.com # 自動偵測認證策略
OpenCLI 在 AI 工具鏈的位置
理解 OpenCLI 的定位,可以用這個三層架構來看:
| 層次 | 職責 | 代表工具 |
|---|---|---|
| 智能決策層 | LLM 推理 | Claude、GPT、Gemini |
| 工具執行層 | 資料抓取與操作 | OpenCLI、MCP tools |
| 資料儲存層 | 持久化 | DB、文件系統 |
OpenCLI 就是讓 AI「有手有眼」的那一層。
OpenCLI vs Browser-Use:該用哪個?
很多人會問:OpenCLI 跟 Browser-Use 有什麼差別?
| 維度 | OpenCLI | Browser-Use |
|---|---|---|
| Token 消耗 | 零消耗(確定性執行) | 每次互動都消耗 token |
| 執行速度 | 毫秒級回應 | 秒級(等待 LLM 解析) |
| 輸出穩定性 | 結構完全一致 | 依賴 LLM 解析品質 |
| 適用範圍 | 87+ 預建 adapter | 理論上任何網站 |
| 複雜互動 | 受 adapter 定義限制 | 靈活(LLM 理解頁面) |
💡 最佳實踐:兩者並用!
高頻、結構化資料抓取 → 用 OpenCLI(省 token、穩定)
低頻、複雜的頁面互動 → 用 Browser-Use(靈活)
快速安裝 ⚡
npm install -g @jackwener/opencli
opencli doctor # 驗證安裝
opencli list # 查看所有可用命令
注意:瀏覽器相關功能需要安裝 Chrome/Chromium 擴充功能(Browser Bridge Extension)。
如果你已經在用 Claude Code,最快的整合方式是:
npx skills add jackwener/opencli
小結 🎯
OpenCLI 讓 AI Agent 從「只會說話」變成「真的能動手」。對新手來說,它的優點很明確:
- ✅ 安裝簡單,一行指令搞定
- ✅ 支援大量常用網站,直接開箱即用
- ✅ 省 token、執行快、輸出穩定
- ✅ 與 Claude Code、Cursor 等主流工具無縫整合
如果你正在打造自己的 AI Agent 工作流,OpenCLI 絕對值得列入你的工具箱!🧰
🔗 GitHub:github.com/jackwener/opencli