AnyCrawl：Node.js/TypeScript 的高效 AI 網頁爬蟲框架

網址

2025-07-01 09:16:18

AnyCrawl 是由 Any4AI 團隊開發的一款開源高效網頁爬蟲工具，採用 Node.js + TypeScript 打造，目標是將網站資料轉換成「LLM Ready」（適用大語言模型）的結構化內容，支持搜尋引擎結果（SERP）、單頁爬取與全站遍歷，同時具備多執行緒與多進程架構，適合批次、大量資料的自動化爬取需求。

核心特色功能

多場景支持：
- SERP 爬取：批次搜尋引擎（Google/Bing/Baidu），自動擷取結果與摘要。
- 單頁內容抓取：快速獲取靜態或動態內容頁面的文字與媒體。
- 全站爬行：智慧化網站遍歷，遞歸下載多頁內容。
高性能架構：
同時採用 multi-thread 與 multi-process，並支援 Redis 快取／排程，讓大型爬取任務平行進行迅速又穩定。
LLM Ready 輸出：
預設生成乾淨的 Markdown 或結構化資料，方便餵入大語言模型進行 RAG、摘要或二次處理。
支援多種瀏覽器引擎：
使用 Cheerio 處理靜態 HTML，也可切換至 Puppeteer 或 Playwright 處理 JavaScript 載入網頁，依需求自由選擇。
Docker 快速部署：
附帶 docker-compose.yml，使本地或雲端佈署更快速／一致，適用於自架服務亦可作為後端 API 模式使用。
API Playground：
內建 API 可測試 JSON 輸出方案，並自動生成程式碼範例，適合開發者快速導入使用。

如果你需要一款高效、支援 SERP、JavaScript 跑框架、並能輸出給大語言模型的全能爬蟲工具，AnyCrawl 是一個值得嘗試的開發工具。

如果您喜歡我們的網站，並且希望支持我們的工作，您可以考慮捐款。我們接受各種形式的捐款，包括一次性捐款和定期捐款。您的捐款將幫助我們維護和改進網站，並為用戶提供更好的體驗。

Map‑It：日本地圖素材免費下載平台，印刷與商用免授權 Relume：整合 AI 的 Webflow & Figma 元件庫與網頁生成工具

課程推薦

AI虛擬角色生成實戰班

本課程將帶你從 AI 虛擬角色的概念出發，認識 AI Persona 的生成流程與應用方式，學會打造專屬自己的 AI 分身。課程中會學習 Prompt 提示詞撰寫、真人感人像生成、固定角色模板建立，並延伸出同一角色的多場景、多服裝與多情境照片。

OpenClaw 龍蝦 AI 代理人實作課：零基礎打造 AI 辦公代理人

本課程從安裝部署、身份設定、技能安裝到實戰應用，帶你從零建立一個專屬的 AI 工作助手－OpenClaw 龍蝦，這個 AI 助手可以替你蒐集情報、摘要文件、整理郵件、生成內容、定時提醒，全部自動完成。

輸入折扣碼 TC1625FR 還可以額外獲得 NT$500 優惠喔。

Google Gemini AI 多媒體生成工具應用實戰：從 Imagen 4、Veo 3、Chirp、Lyria 到 nano-banana

如何只用文字說明提示就生成不同的圖像結果？亦或是會議上的語音檔轉文字？這是一堂通盤性、全面性的Google Gemini AI多媒體生成工具應用實戰！

輸入折扣碼 TC1609EW 還可以額外獲得 NT$500 優惠喔。

AI 數據自動化工具實戰班：Google Sheet x Apps Script x NotebookLM 暨資料處理函數

本門課將教你如何善用 AI 功能與工具，進行自動分析數據提供有幫助的建議與洞察，以及使用 AI 驅動的公式自動化計算。

輸入折扣碼 TC1615VU 還可以額外獲得 NT$500 優惠喔。

3 小時掌握自動化工作新手應用實作 – n8n AI Agent

這門課程將帶你循序漸進掌握 n8n 的自動化技巧，從基礎認識與操作入門，到進階節點應用與流程控制，再到 Google 服務的整合實作，最後延伸至部署思維與 OpenAI API 的智慧化串接。

輸入折扣碼 TC1600UY 還可以額外獲得 NT$500 優惠喔。

用 AI 生成網站？ AI 高效網站設計實戰課：ChatGPT X HTML X SEO

利用 AI 提升網站設計效率與 SEO 排名！了解如何透過 ChatGPT 等工具快速建立 HTML 架構，優化關鍵字與用戶體驗，讓網站更具競爭力。

輸入折扣碼 TC1533SL 還可以額外獲得 NT$500 優惠喔。

AI工作術全面學習實戰營：6 堂精選課程，學會最好用 AI 工具，翻轉你的人生

《PChome雜誌》攜手 5 位在 AI 領域的專業講師，打造上述 6 堂實用課程，教你學會時下最好用的 AI 工具，導入生成式 AI 來產製工作內容，改造並升級你的工作流程。

輸入折扣碼 ZERO2024 還可以額外獲得 NT$400 優惠喔。

HTML與SEO實戰應用—並以ChatGPT助力提升網站品質與流量

本課程專為希望深入了解 HTML 並有效結合 SEO 策略的學員設計。我們將重點放在 HTML 的深度學習與應用上，同時穿插介紹如何透過搜索引擎優化提升網站能見度。透過即時互動式的直播教學，加上 ChatGPT 的輔助，您將學習到如何建立一個結構優良、美觀且符合 SEO 標準的網站。這不僅會提升網站的用戶體驗，還會大幅提高網站的搜索引擎排名，進而增加訪客流量和潛在客戶。