標籤: OCR 頁1

OCR相關的文章,目前共收錄 3 篇內容。

Docling:高效文件解析與轉換的開源工具
網路資源

Docling:高效文件解析與轉換的開源工具

Docling 是一款開源文件解析和轉換工具,支持 PDF、DOCX、PPTX、HTML、Markdown 等多種格式,能將文件轉換為 Markdown 或 JSON,適合文檔管理和自動數據提取。其特點包括進階 PDF 解析、統一 DoclingDocument 格式、元數據提取、OCR 支援,以及與 LlamaIndex 和 LangChain 整合,支持文件檢索與問答應用。Docling 配備 CLI 界面,便於批量處理,是數據科學家、文檔撰寫者和知識管理專家的理想工具。

Image/Manga Translator:一鍵翻譯漫畫圖片,開啟語言無界閱讀
網路資源

Image/Manga Translator:一鍵翻譯漫畫圖片,開啟語言無界閱讀

在漫畫和圖片充斥的互聯網世界,語言差異經常成為閱讀和理解的障礙。但現在,有了GitHub上的Image/Manga Translator,這個問題可以迎刃而解。這個項目利用先進的OCR(光學字符識別)和機器翻譯技術,可以一鍵翻譯漫畫和圖片中的文字,讓非原語言讀者也能享受豐富的內容。

ScantextAI:利用 AI 將圖片的文字掃描出來後並存成 PDF
網路資源

ScantextAI:利用 AI 將圖片的文字掃描出來後並存成 PDF

ScanTextAI 是一個功能強大的線上服務,利用先進的光學字符識別(OCR)技術和人工智慧,輕鬆從圖像中提取和識別文字。不論是從紙質文件、照片或掃描件中,ScanTextAI 都能輕鬆地提取出文字,並將其轉換為可編輯和可搜尋的格式。