Auto-Subs：用 AI 自動為影片生成字幕的開源工具

網址

https://github.com/tmoroney/auto-subs

2025-11-02 08:58:50

Auto-Subs 是由開發者 tmoroney 建立的開源工具，主要用於：

「自動將影片音訊轉錄成文字，並生成可直接使用的字幕檔案（如 .srt、.vtt）。」

它的原理是透過語音辨識模型（Speech-to-Text, STT），分析影片中的聲音內容，將語音自動轉成文字，並依照時間軸生成對應的字幕片段。

功能特色

以下是 Auto-Subs 的幾個核心功能與特點，對於影片創作者與內容行銷人來說相當實用：

1. 自動語音辨識（Speech Recognition）

利用 OpenAI Whisper 或 Vosk 等開源模型進行語音辨識。
支援多語言（包括英文、中文、日文等），準確度極高。
可自動偵測語言，不需事先指定。

2. 支援多種影片格式

可輸入多種影音檔案格式，例如：.mp4, .mov, .mkv, .avi, .mp3。
內建 FFmpeg 處理流程，自動擷取音訊並轉換為可辨識格式。

3. 字幕檔輸出

生成 .srt（標準字幕格式）或 .vtt（網頁用格式）。
自動標示時間軸，可直接匯入 YouTube、Premiere Pro、DaVinci Resolve 等軟體。

4. 離線執行（Local Execution）

完全可離線執行，無需雲端 API。
適合保護隱私或不想將影音上傳至第三方服務的使用者。

5. AI 驅動準確度

若使用 OpenAI Whisper 模型，可達商業級辨識準確度。
對於背景音干擾、口音差異也具良好容錯率。

6. 開源與可自訂

Python 撰寫，可自由修改模型、語言設定、輸出格式。
亦可整合至自動化後製流程（例如結合 FFmpeg 與 Premiere 腳本）。

Auto-Subs 最大的優點就是「輕量又實用」。
不像某些商業字幕工具需要雲端服務或付費 API，它能完全在本機執行，對注重隱私或頻繁處理影片的使用者特別有吸引力。

在實測中，如果影片音質清晰、說話速度正常，使用 Whisper 模型的辨識準確率可達 95% 以上。中文辨識表現也相當穩定。
生成的字幕時間軸幾乎與語音同步，後期只需微調文字格式即可。

另一個值得稱讚的地方是「開放性」：
Auto-Subs 的程式碼乾淨，容易整合進自動化流程。例如：

在影片上傳流程中自動產生字幕。
在直播錄影後批次生成文字稿。
結合 ChatGPT API 自動翻譯字幕成多語版本。

這讓它不只是單純的字幕工具，更像是一個「AI 影音後製模組」。

注意事項

運算需求較高：若使用大型 Whisper 模型，需具備 GPU（例如 NVIDIA 顯示卡）才能加速處理。
辨識效果取決於音質：背景噪音、多人對話、音量差異都可能影響結果。
非即時生成：目前屬於「離線批次轉錄」工具，非即時字幕。
需基本命令列操作經驗：雖然使用簡單，但仍需使用 CLI 執行。

總結

Auto-Subs 是一款簡潔、強大、完全開源的 AI 字幕生成工具。
它不僅能節省人工聽打時間，更能讓影片後製流程自動化，輕鬆輸出高品質字幕。

在影片資訊爆炸的時代，擁有這樣一款「智慧字幕助手」，能大幅提升工作效率與內容可及性。
無論你是創作者、教師、行銷人或開發者，Auto-Subs 都是值得加入工具箱的一項利器。

如果您喜歡我們的網站，並且希望支持我們的工作，您可以考慮捐款。我們接受各種形式的捐款，包括一次性捐款和定期捐款。您的捐款將幫助我們維護和改進網站，並為用戶提供更好的體驗。

Deploy Your Own SaaS：讓你用開源方式快速打造並部署自己的 SaaS 平台 Affinity Studio：可以取代 Photoshop、Illustrator 的專為現代設計師打造的全能工具軟體

課程推薦

AI虛擬角色生成實戰班

本課程將帶你從 AI 虛擬角色的概念出發，認識 AI Persona 的生成流程與應用方式，學會打造專屬自己的 AI 分身。課程中會學習 Prompt 提示詞撰寫、真人感人像生成、固定角色模板建立，並延伸出同一角色的多場景、多服裝與多情境照片。

OpenClaw 龍蝦 AI 代理人實作課：零基礎打造 AI 辦公代理人

本課程從安裝部署、身份設定、技能安裝到實戰應用，帶你從零建立一個專屬的 AI 工作助手－OpenClaw 龍蝦，這個 AI 助手可以替你蒐集情報、摘要文件、整理郵件、生成內容、定時提醒，全部自動完成。

輸入折扣碼 TC1625FR 還可以額外獲得 NT$500 優惠喔。

Google Gemini AI 多媒體生成工具應用實戰：從 Imagen 4、Veo 3、Chirp、Lyria 到 nano-banana

如何只用文字說明提示就生成不同的圖像結果？亦或是會議上的語音檔轉文字？這是一堂通盤性、全面性的Google Gemini AI多媒體生成工具應用實戰！

輸入折扣碼 TC1609EW 還可以額外獲得 NT$500 優惠喔。

AI 數據自動化工具實戰班：Google Sheet x Apps Script x NotebookLM 暨資料處理函數

本門課將教你如何善用 AI 功能與工具，進行自動分析數據提供有幫助的建議與洞察，以及使用 AI 驅動的公式自動化計算。

輸入折扣碼 TC1615VU 還可以額外獲得 NT$500 優惠喔。

3 小時掌握自動化工作新手應用實作 – n8n AI Agent

這門課程將帶你循序漸進掌握 n8n 的自動化技巧，從基礎認識與操作入門，到進階節點應用與流程控制，再到 Google 服務的整合實作，最後延伸至部署思維與 OpenAI API 的智慧化串接。

輸入折扣碼 TC1600UY 還可以額外獲得 NT$500 優惠喔。

用 AI 生成網站？ AI 高效網站設計實戰課：ChatGPT X HTML X SEO

利用 AI 提升網站設計效率與 SEO 排名！了解如何透過 ChatGPT 等工具快速建立 HTML 架構，優化關鍵字與用戶體驗，讓網站更具競爭力。

輸入折扣碼 TC1533SL 還可以額外獲得 NT$500 優惠喔。

AI工作術全面學習實戰營：6 堂精選課程，學會最好用 AI 工具，翻轉你的人生

《PChome雜誌》攜手 5 位在 AI 領域的專業講師，打造上述 6 堂實用課程，教你學會時下最好用的 AI 工具，導入生成式 AI 來產製工作內容，改造並升級你的工作流程。

輸入折扣碼 ZERO2024 還可以額外獲得 NT$400 優惠喔。

HTML與SEO實戰應用—並以ChatGPT助力提升網站品質與流量

本課程專為希望深入了解 HTML 並有效結合 SEO 策略的學員設計。我們將重點放在 HTML 的深度學習與應用上，同時穿插介紹如何透過搜索引擎優化提升網站能見度。透過即時互動式的直播教學，加上 ChatGPT 的輔助，您將學習到如何建立一個結構優良、美觀且符合 SEO 標準的網站。這不僅會提升網站的用戶體驗，還會大幅提高網站的搜索引擎排名，進而增加訪客流量和潛在客戶。