Stagehand 是由 Browserbase 開發、開源於 GitHub(browserbase/stagehand),專為 AI 時代的瀏覽器自動化而設計。這套框架解決了傳統自動化工具(如 Selenium、Playwright、Puppeteer)過於剛硬,以及完全以 agent 為主的方法過於不穩的痛點。它融合寫 code 和自然語言控制的優勢,讓經驗豐富的開發者能精確掌控,又能在不熟頁面時交給 LLM 處理。
核心特色一覽
-
自然語言與程式混搭操作
Stagehand 提供act()
,extract()
,observe()
三大基本原語 (atomic primitive),具備高度細節控制,同時搭配agent()
可進行跨步邏輯推理,實現精準與靈活的完美協作。 -
預覽與緩存動作提升效率
開發流程中可先用page.observe()
查看 LLM 建議,再由page.act()
執行;搭配動作緩存機制,減少 API 調用成本,提高重複任務效能 。 -
深度整合 Playwright 和 Browserbase
Stagehand 完整兼容 Playwright,開發者可沿用熟悉 API,並可無痛部署至 Browserbase 雲端環境;同時享有 stealth 模式、proxy 旋轉、session replay、captcha 解決等進階功能。 -
LLM 自適應模型切換
根據工作階段自動選擇最適 LLM:GPT 更擅長執行操作、Claude 長於推理、Gemini 適合觀察與結構化輸出;內部機制會根據使用情境靈活切換 。
Stagehand 打造出一種「可控又彈性」的瀏覽器自動化模式,在工程維護性、可靠性與開發效率間取得良好平衡。對有網頁流程自動化需求、又希望搭上 AI 浪潮的台灣開發者來說,是值得深入研究與實作的開源選擇。建議有興趣者先從 npx create-browser-app
快速上手,再延伸至搭配 Browserbase 雲端部署與模組整合。