
這是 X 上 @MinLiBuilds 分享的節省 token 的用法,我在把它整理成文章跟大家分享。
--
在生成式 AI 的實務應用中,許多人會發現一個很現實的問題:費用很快就爆掉。
尤其當你使用像 Claude 這類強大的模型進行研究、分析或開發時,只要涉及大量資料(例如論文、日誌、報告),token 消耗會呈現線性甚至倍數成長。
本文將介紹一個實測有效的方法:
透過 NotebookLM 與 Claude 分工合作,不僅可以降低成本,還能提升效率與準確性。
為什麼你的 Token 會爆掉?
常見的使用模式是:
- 把大量資料貼進對話(例如論文、log)
- 反覆提問與分析
- 依賴模型理解全文
這會導致:
- 每次提問都重新計算 token
- cache 命中率低(TTL 約 1 小時)
- 成本隨資料量線性成長
本質問題:你把 Claude 當「全文搜尋工具」在用。
解法:AI 分工架構
核心概念:
不要讓 Claude 讀原始資料,而是讓它只處理「整理後的結果」
整體運作流程
下面這張流程圖就是這套架構的核心運作方式:

對應流程說明如下:
1.你提出課題 / 子問題
2.Claude 判斷哪些地方需要「領域知識」
3.Claude 向 NotebookLM 查詢(取得帶引用答案)
4.Claude 根據答案繼續執行(寫程式 / 分析 / 自動化)
5.若出現新問題 → 回到查詢(形成迴圈)
6.最終輸出結果
角色分工
NotebookLM(老師)
- 儲存所有原始資料(論文、文件、筆記)
- 提供「帶引用」的答案
- 限制在資料來源內,不亂推論
- 使用 RAG(檢索)而非全文理解
Claude(助手)
- 推理與決策
- 撰寫程式 / 執行腳本
- 整理分析結果
- 遇到不確定 → 問 NotebookLM
使用者(決策者)
- 提出問題
- 在關鍵節點介入
為什麼這樣可以省錢?
1.成本模型不同(關鍵)
傳統方式:
- 大量資料直接輸入
- 每次提問都重新計算 token
- 成本隨資料量線性增加
NotebookLM(RAG):
- 只取相關片段
- Claude 只看到精簡內容
- 成本幾乎固定
2.避開 cache 限制
- cache TTL 約 1 小時
- 研究場景常中斷 → 幾乎失效
- 本方法:資料根本不進 Claude → 不依賴 cache
3.提升可靠性
NotebookLM 回答:
- 每句都有引用
- 可回原文
- 不會亂編
Claude 不需反覆驗證 → 節省時間與 token
實測成本差異
NotebookLM + Claude
- 5 輪研究:約 $0.55
傳統方式
- 同樣情境:約 $9.59
差距:約 17 倍
核心原因
原始資料完全沒有進入 Claude
缺點
- 回應速度較慢(約慢 2~3 倍)
- NotebookLM 查詢需 16~48 秒
適合「研究型」,不適合「即時型」
適用情境
適合
- 論文研究
- 文件分析
- 多輪推理任務
- 需要引用與準確性
不適合
- 小問題(<5k tokens)
- 單次問答
- 即時互動需求
三大應用場景
1.學術研究
- 論文比較
- 方法分析
- 公式驗證
2.投資分析(招股書)
- 500 頁文件快速解析
- 風險辨識
- 多公司比較
4 小時 → 20 分鐘
3.個人知識庫
- Obsidian / Notion 整合
- 長期觀點分析
- 跨文件理解
技術實作方式
可透過第三方工具整合:
- notebooklm-client
/notecraft chat指令- Claude 自動調用 NotebookLM
核心流程(簡化版)
- 資料 → NotebookLM
- Claude → 判斷是否需要查詢
- NotebookLM → 回答(含引用)
- Claude → 執行任務
- 循環直到完成
最終結論
這套方法真正的突破點,不在於工具本身,而在於思維的轉換。
過去我們習慣把 AI 當成一個「萬能大腦」,什麼資料都丟進去、什麼問題都直接問;但當資料量一變大,這種方式很快就會遇到成本、效率與準確性的瓶頸。
而 NotebookLM + Claude 的組合,則提供了一種更接近「真實工作流程」的架構:
- 資料處理與檢索交給專門工具(NotebookLM)
- 推理、決策與執行交給 AI 助手(Claude)
- 人類只專注在關鍵判斷與方向控制
這不只是省錢,而是讓整個 AI 使用方式從「單一模型依賴」,進化成「模組化協作系統」。
當你的資料越多、任務越複雜,這種分工帶來的優勢會越明顯——
不只是 Token 成本降低,更重要的是:
你終於可以放心把 AI 當成長期工作夥伴,而不是一個隨時可能讓你破產的工具。
如果說生成式 AI 的下一個階段是 Agent,那麼這種「工具分工 + 流程編排」的思維,幾乎就是未來所有 AI 系統的基礎架構。