標籤: TTS 頁1

TTS相關的文章,目前共收錄 10 篇內容。

VoxCPM2:用一段語音打造專屬配音,零成本AI聲音克隆開源專案
網路資源

VoxCPM2:用一段語音打造專屬配音,零成本AI聲音克隆開源專案

VoxCPM2 是由 OpenBMB 與清華大學推出的開源語音生成模型,只要上傳一段語音即可快速複製聲音,並支援多語言 TTS、情緒控制與本地部署,零訂閱成本,適合打造高擬真語音應用。

OmniVoice:打造即時語音互動的全能型 AI 語音代理框架
網路資源

OmniVoice:打造即時語音互動的全能型 AI 語音代理框架

OmniVoice 是 k2-fsa 推出的開源語音 AI 框架,整合 ASR、LLM 與 TTS,支援低延遲即時對話,幫助開發者快速打造可聽、可說、可互動的語音 Agent 系統。

VibeVoice:微軟開源語音生成模型,打造更自然的 AI 語音體驗
網路資源

VibeVoice:微軟開源語音生成模型,打造更自然的 AI 語音體驗

VibeVoice 是 Microsoft 開源的 AI 語音生成(TTS)專案,主打自然語音、情緒與風格控制,適用於 AI 助理、內容創作與語音互動應用,幫助開發者打造更接近真人的語音體驗。

Automate-Faceless-Content:把「無臉內容」變成可量產流程的自動化工具
網路資源

Automate-Faceless-Content:把「無臉內容」變成可量產流程的自動化工具

Automate-Faceless-Content 是開源無臉內容自動化專案,整合文字生成、語音合成與影片輸出,打造可擴充的短影音量產流程。

Microsoft VibeVoice-Realtime-0.5B:輕量級即時 AI 語音生成模型的新標竿
網路資源

Microsoft VibeVoice-Realtime-0.5B:輕量級即時 AI 語音生成模型的新標竿

微軟震撼發布 VibeVoice-Realtime-0.5B!這款僅 0.5B 參數的輕量化 AI 語音模型,打破硬體限制,實現超低延遲的即時互動。它不僅告別機械音、保留真實語感,更讓一般顯卡也能流暢運行。立即閱讀,深入了解這款 Hugging Face 開源模型如何革新端側 AI 與遊戲應用!

Luvvoice:免費線上文字轉語音工具
網路資源

Luvvoice:免費線上文字轉語音工具

Luvvoice 是一款免費線上文字轉語音工具,支援 70+ 種語言與 200+ 種語音樣式,可自訂語速與語調並下載 MP3,適合內容創作者與語音無障礙用途。

Dia:打造逼真對話式語音的開源 TTS 模型
網路資源

Dia:打造逼真對話式語音的開源 TTS 模型

Dia 是專為自然對話設計的開源 TTS 模型,支援多角色、語氣控制與非語言音效生成,適用於有聲書、遊戲語音與互動式語音體驗。

Real-Time Voice Cloning:讓你的聲音可以即時被複製的 AI 聲音克隆開源專案
網路資源

Real-Time Voice Cloning:讓你的聲音可以即時被複製的 AI 聲音克隆開源專案

Real-Time Voice Cloning 是開源 AI 聲音克隆工具,能即時合成模仿聲音,僅需幾秒樣本就能完成,支援開發語音助手、虛擬角色等創意應用。

pyVideoTrans:完全免費開源的 AI 影片翻譯與配音工具
網路資源

pyVideoTrans:完全免費開源的 AI 影片翻譯與配音工具

pyVideoTrans:免費開源影音翻譯與配音軟體,支援多語語音辨識、字幕翻譯與 TTS 合成,可全自動完成影片翻譯配音,也能單獨使用模組。跨平台支援 Windows、macOS、Linux,並提供線上版本,適合教育、內容創作與國際溝通。

Conva.AI Magic Studio:一鍵打造智慧助手的終極解決方案
網路資源

Conva.AI Magic Studio:一鍵打造智慧助手的終極解決方案

在現代應用程式開發中,整合 AI 助手不僅能提升使用者體驗,更能大幅提高應用程式的智慧化程度。Conva.AI 提供了一個革命性的平台,只需一鍵即可生成適用於各種應用程式的 AI 助手,讓開發者能夠快速且輕鬆地為應用程式增添 AI 功能。