Jina AI 的 Reader API 是一款專門用來提升大型語言模型(LLM)和 RAG 系統的輸入品質的工具。這項服務能將任何網址內容轉化成適合LLM的格式,幫助使用者簡化從網頁抓取數據的流程。它自動去除HTML中的雜訊,如標籤和 script,只提取核心內容。此外,Reader API 還支持即時串流模式,可加快處理速度,且完全免費,無需API密鑰即可使用。對於需要高品質網頁內容輸入的開發者來說,這是一個極佳的選擇。
我這邊有稍微測試一下,你可以把想要提取資料的網址輸入,經過一段時間就可以過濾出資訊,然後你就可以在下面問他問題了。
如果會寫程式的話,可以透過串接這隻 API 做到在任何服務上增加一個介紹網站的功能,有興趣的可以嘗試看看。