
Anthropic 官方發布的 Agent Skills 建構完整指南,相信詳讀後會對開發 Skill 會有很多幫助。
什麼是 Skill?為什麼它是 AI 工作流的關鍵核心
在實際使用 AI 的過程中,許多人都有相同的痛點:
每次對話都要重新解釋偏好、流程與背景知識,既耗時又不穩定。
Skill 正是為了解決這個問題而設計,以下是這份文件的重點摘要。
Skill 的本質:一次教會,永久生效
Skill 本質上是一個資料夾,其中核心是一個 SKILL.md 檔案,使用 Markdown 搭配 YAML frontmatter 撰寫。
它的作用很簡單也很強大:
把你反覆向 AI 解釋的偏好、流程與專業知識,封裝成一次性的「教學材料」
之後每次對話,只要情境符合,AI 就會自動套用
你可以把 Skill 理解為 AI 的:
標準操作手冊(Standard Operating Procedure, SOP)
不再需要每次重新 prompt,而是讓 AI 按照你預先定義的工作流與最佳實踐自動執行。
Skill 的標準資料夾結構
一個完整的 Skill 具備以下結構:
your-skill-name/
├─ SKILL.md # 必須:主指令文件
├─ scripts/ # 可選:可執行腳本
├─ references/ # 可選:參考文件、規範、長文
└─ assets/ # 可選:模板、範例、圖示等資源
其中 SKILL.md 是唯一必須存在的檔案,其餘資料夾則依需求擴充。
三層「漸進式資訊披露」設計
Skill 採用一種非常關鍵的設計理念:只在需要時載入必要資訊。
第一層:YAML Frontmatter(永遠載入)
-
包含
name與description -
永遠存在於系統提示詞中
-
作用是判斷「這個 Skill 是否該被啟用」
description 就像 Skill 的「觸發器」
第二層:SKILL.md 正文(條件載入)
-
包含完整指令、流程步驟、範例
-
只有在 AI 判斷此 Skill 與當前任務相關時才會載入
第三層:references/(按需讀取)
-
長文件、規範、知識庫
-
僅在實際需要時才讀取
即使啟用數十個 Skill,也不會一次塞滿上下文
寫得好的 description,才能在正確時機被觸發
Skill 與 MCP 的關係:工具 vs 智慧
官方指南用了一個非常貼切的比喻:
MCP 是專業廚房,Skill 是菜譜
| MCP(連接層) | Skill(知識層) |
|---|---|
| 連接外部服務 | 定義如何高效使用這些服務 |
| 提供工具能力 | 封裝最佳實踐與流程 |
| 解決「能做什麼」 | 解決「該怎麼做」 |
沒有 Skill 的 MCP,就像把專業廚房交給新手;
有 Skill,等於同時附上主廚等級的操作手冊。
對 MCP 服務提供商來說,Skill 是重要的差異化競爭力。
三大 Skill 使用場景
Category 1:文件與資產創作
不依賴外部工具,完全使用 AI 內建能力。
常見應用
-
文件撰寫
-
前端設計規範
-
簡報、試算表生成
核心技巧
-
內嵌風格指南
-
固定模板結構
-
品質檢查清單
Category 2:工作流自動化
將多步驟流程標準化執行。
常見應用
-
Skill 建立引導流程
-
專案初始化
-
重複性任務自動化
核心技巧
-
步驟間驗證門控
-
可回滾設計
-
迭代優化循環
Category 3:MCP 增強型 Skill
為既有 MCP 服務補上「怎麼用」的智慧層。
典型案例
-
自動拉取錯誤資料
-
分析 PR
-
產出修復建議
核心技巧
-
多 MCP 調用編排
-
領域知識內嵌
-
決策順序明確
YAML Frontmatter 的關鍵規則
硬性限制(必須遵守)
-
檔名必須是
SKILL.md(大小寫敏感) -
資料夾名稱只能使用 kebab-case
-
Skill 內不得出現
README.md -
禁止使用
< >(防止提示詞注入) -
名稱不得包含
claude或anthropic
description 決定 Skill 成敗
一個好的 description 必須同時包含三個元素:
-
做什麼
-
什麼情況下使用
-
具備哪些關鍵能力
寫得越貼近使用者實際會說的話,觸發成功率越高。
五大實戰模式
-
順序式工作流
適合嚴格流程,強調依賴與回滾 -
多 MCP 協調
跨服務資料流與集中錯誤處理 -
迭代精煉
明確品質標準與停止條件 -
情境感知工具選擇
依條件選擇最合適工具 -
領域專業智能
合規、風險、審計優先於行動
Skill 的測試策略
觸發測試
-
不同說法是否都能啟用
-
無關請求是否不會誤觸發
可直接詢問 AI:「你什麼時候會使用這個 Skill?」
功能測試
-
輸出是否正確
-
API 是否成功
-
邊界條件是否覆蓋
效能對比
實務上常見成效包括:
-
對話輪次從 15 降到 2
-
API 失敗次數歸零
-
Token 消耗減半
分發與 API 使用方式
-
個人用戶:上傳 Skill 資料夾或放入本地目錄
-
組織級:由管理員統一部署與更新
-
API:透過
/v1/skills管理,並在 Messages API 中引入
Anthropic 將 Skill 視為開放標準,目標是跨平台、跨生態使用,而不只限於單一 AI。
常見問題與最佳實踐
Skill 不觸發
→ description 太模糊,加入更貼近使用者語句的觸發詞
Skill 過度觸發
→ 範圍過寬,加入負向條件
指令不被遵循
→ 精簡指令、關鍵內容前置,必要時改用腳本驗證
上下文過大變慢
→ 主檔控制在 5,000 字內,細節移至 references/
一個進階但非常重要的技巧
關鍵驗證步驟,請用 scripts,而不是自然語言。
程式碼是確定性的,語言理解不是。
這是讓 Skill 從「好用」進化到「可靠」的關鍵分水嶺。