標籤: 文字轉語音頁1

文字轉語音相關的文章，目前共收錄 38 篇內容。

Pixelle-Video：一句話自動生成短影音，打造 AI 全流程影片創作引擎

網路資源

2026-07-13 11:21:52

Pixelle-Video：一句話自動生成短影音，打造 AI 全流程影片創作引擎

Pixelle-Video 是開源 AI 短影音生成平台，整合 AI 腳本、圖片、影片、TTS、背景音樂與自動剪輯，支援 GPT、DeepSeek、Ollama 等模型，快速打造 YouTube Shorts、TikTok 與 Reels 內容。

網路資源

2024-10-07 09:13:30

Voice-Pro：整合字幕、翻譯及 TTS 的全方位解決方案

Voice-Pro 是一款開源 AI 語音工作站，整合語音辨識、語音合成、翻譯、字幕生成與聲音克隆功能，支援 Whisper 等模型，適合影音創作者與多語言內容製作需求。

網路資源

2026-04-13 08:29:12

VoxCPM2：用一段語音打造專屬配音，零成本AI聲音克隆開源專案

VoxCPM2 是由 OpenBMB 與清華大學推出的開源語音生成模型，只要上傳一段語音即可快速複製聲音，並支援多語言 TTS、情緒控制與本地部署，零訂閱成本，適合打造高擬真語音應用。

網路資源

2026-04-09 09:35:19

OmniVoice：打造即時語音互動的全能型 AI 語音代理框架

OmniVoice 是 k2-fsa 推出的開源語音 AI 框架，整合 ASR、LLM 與 TTS，支援低延遲即時對話，幫助開發者快速打造可聽、可說、可互動的語音 Agent 系統。

網路資源

2026-03-29 10:08:43

VibeVoice：微軟開源語音生成模型，打造更自然的 AI 語音體驗

VibeVoice 是 Microsoft 開源的 AI 語音生成（TTS）專案，主打自然語音、情緒與風格控制，適用於 AI 助理、內容創作與語音互動應用，幫助開發者打造更接近真人的語音體驗。

AIGCPanel：影音合成與聲音克隆的終極中控台，一站式打造全能 AI 影音工作室

網路資源

2026-02-07 09:26:34

AIGCPanel：影音合成與聲音克隆的終極中控台，一站式打造全能 AI 影音工作室

想做影片又要做配音，工具太散好麻煩？AIGCPanel 是一款開源的全能 AI 影音整合平台！一站式搞定影片合成、聲音克隆與 TTS 配音。免切換軟體，在同一後台就能完成影像到聲音的「一條龍」製作。立即部署這套 GitHub 神器，讓你的數位內容生產效率狂飆！

網路資源

2026-01-24 16:14:33

PersonaPlex：讓語音助理「邊聽邊說」的全雙工對話模型

厭倦傳統語音助理的機械感？NVIDIA 開源的 PersonaPlex 帶來革命性的全雙工 Speech-to-speech 技術！它跳過 ASR 與 TTS 轉換，實現真正的即時插話與零樣本角色控制。想打造具備真人節奏感的高效語音 Agent？這篇解析帶你掌握未來對話互動的關鍵技術。

Automate-Faceless-Content：把「無臉內容」變成可量產流程的自動化工具

網路資源

2026-01-07 08:58:17

Automate-Faceless-Content：把「無臉內容」變成可量產流程的自動化工具

Automate-Faceless-Content 是開源無臉內容自動化專案，整合文字生成、語音合成與影片輸出，打造可擴充的短影音量產流程。

Fun-Audio-Chat：結合語音理解與生成的開源 Audio LLM 專案

網路資源

2025-12-26 09:02:41

Fun-Audio-Chat：結合語音理解與生成的開源 Audio LLM 專案

Fun-Audio-Chat 是開源語音對話 AI 專案，結合語音理解、語音生成與 LLM，打造真正 Speech-to-Speech 的 Audio LLM 互動體驗。

支援百種語言、五種語音風格！Grok Voice Agent API 助你打造智慧語音助手

網路資源

2025-12-19 09:48:57

支援百種語言、五種語音風格！Grok Voice Agent API 助你打造智慧語音助手

Grok Voice Agent API 正式登場，支援即時語音互動、多語言切換與工具呼叫。適用語音助理、客服與 IoT 應用，開啟語音開發新時代！

Microsoft VibeVoice-Realtime-0.5B：輕量級即時 AI 語音生成模型的新標竿

網路資源

2025-12-06 09:01:46

Microsoft VibeVoice-Realtime-0.5B：輕量級即時 AI 語音生成模型的新標竿

微軟震撼發布 VibeVoice-Realtime-0.5B！這款僅 0.5B 參數的輕量化 AI 語音模型，打破硬體限制，實現超低延遲的即時互動。它不僅告別機械音、保留真實語感，更讓一般顯卡也能流暢運行。立即閱讀，深入了解這款 Hugging Face 開源模型如何革新端側 AI 與遊戲應用！

網路資源

2025-11-15 03:08:48

CoeFont CLOUD：用 AI 打造專屬聲音的語音合成平台

CoeFont CLOUD 是 AI 聲音合成平台，可快速打造個人化語音，支援配音、API 整合與商用授權，讓聲音成為具品牌辨識的數位資產。

網路資源

2025-10-27 17:13:23

IndexTTS：開源的 AI 文字轉語音系統，支援情感與語速控制

IndexTTS 是一款工業級零樣本文字轉語音系統，支援從僅一段語者語音樣本即複製音色、情感與語速控制，開源部署、支援中英語音合成與情感表現，適合配音、語音助手、內容製作等高品質語音應用。

網路資源

2025-10-24 10:09:33

NaturalReader：高品質文字轉語音平台

NaturalReader 是由 NaturalSoft Limited 提供的高品質文字轉語音服務，支援多語言、多格式輸入（PDF／DOCX／ePub／圖片文字），並可下載音檔（MP3/WAV）或朗讀網頁，適合有聲教材、配音與無障礙閱讀需求。

網路資源

2024-08-03 08:58:03

Luvvoice：免費線上文字轉語音工具

Luvvoice 是一款免費線上文字轉語音工具，支援 70+ 種語言與 200+ 種語音樣式，可自訂語速與語調並下載 MP3，適合內容創作者與語音無障礙用途。

網路資源

2023-12-17 09:56:33

TTSMaker：免費線上 AI 文字轉語音工具

TTSMaker 是一款免費線上文字轉語音工具，支援 100+ 種語言與多種語音樣式，可下載 MP3/WAV 檔並允許商業用途，適合影音創作、有聲書、教學等快速配音需求。

網路資源

2025-10-20 06:00:51

Dia：打造逼真對話式語音的開源 TTS 模型

Dia 是專為自然對話設計的開源 TTS 模型，支援多角色、語氣控制與非語言音效生成，適用於有聲書、遊戲語音與互動式語音體驗。

網路資源

2024-12-23 08:28:12

ElevenLabs：好用的 AI 音效生成、文字轉語音平台

ElevenLabs 是一款高級 AI 語音生成平台，提供自然語音合成、語音克隆、多語言支持與即時生成 API，適用於有聲書、廣告、遊戲與教育等多場景應用。

標籤: 文字轉語音 頁1

標籤: 文字轉語音頁1