文字轉語音相關的文章,目前共收錄 24 篇內容。
ElevenLabs 是一款高級 AI 語音生成平台,提供自然語音合成、語音克隆、多語言支持與即時生成 API,適用於有聲書、廣告、遊戲與教育等多場景應用。
PopPop AI 是一款多功能的 AI 聲音工具平台,提供文本轉音效、音軌分離、歌曲翻唱與文字轉語音等服務。支援多語言與多種聲音模型,操作簡單,適合音樂創作者與內容製作者快速生成高品質音效與語音內容。
AudioTextHub 是免費 TTS 平台,支援多語多聲線,3 秒內產出自然語音,適用影片旁白、無障礙閱讀及 API 開發整合。
AIVocal 是一款整合語音生成、編輯、分離與控制的一站式 AI 聲音平台,支援文字轉語音、Podcast 快速生成、聲音克隆與樂器分離,特別適合 Podcaster、創作者與音訊專業人士。
Kapwing 是一款線上影片與多媒體編輯平台,支援 AI 自動字幕、影片去背、格式轉換與團隊協作,適合行銷、教學與社群內容製作,操作簡便、功能強大。
Kokoro TTS 是一款開源的文字轉語音(TTS)模型,由 Hugging Face 社群開發,支援英語、法語、日語、韓語和中文等語言,並以僅 8,200 萬參數提供高效能與高品質的語音合成,適合各類應用場景。
ebook2audiobook 是一款開源工具,利用先進的文字轉語音技術,將 EPUB、PDF 等格式的電子書轉換為高品質有聲書,支援語音自訂與本地處理,為讀者提供便捷的聆聽閱讀體驗。
Fish Audio,免費 AI 文字轉語音與聲音克隆工具,支援多語言、高品質語音合成及快速聲音克隆,適用於教育、商業、遊戲等多元場景,提升語音應用體驗!
SoniTranslate 是一款開源影片翻譯工具,專為將影片和音訊轉換成多語言設計,結合 TTS 技術實現精準同步音訊。支援 Gradio 庫的互動介面,操作簡單,適合企業國際化、教育影片和娛樂字幕翻譯。支持自訂語音色調,為內容本地化和多語分享提供便捷方案。
Podcastfy Demo 是一個開源專案,利用語音合成技術自動將文字轉換為 Podcast,支援多語言、多語音選擇及 RSS 發佈,適合內容創作者、教育機構和企業使用。
Voice-Pro 是一款專業語音轉錄、翻譯及語音合成解決方案,提供多語字幕添加、即時翻譯、背景音移除、字幕自動生成等功能,適合全球市場拓展及多語言支援。
PDF2Audio 是由麻省理工學院 (MIT) 的 LAMM 開發的一款開源工具,專門將 PDF 文件轉換成音訊檔案,讓使用者能夠透過聆聽方式來瀏覽和吸收文件內容。無論是學術論文、電子書、工作報告,PDF2Audio 都能快速將其轉換為音訊,方便使用者在通勤、運動等情境下有效地「聽取」資訊,提升學習與工作的效率。
Azure TTS 是一個免費的線上文字轉語音(Text-to-Speech, TTS)工具,專為使用者提供高品質的語音合成功能。這個平台支援多種語言和聲音選項,無論是用於創作影片、製作有聲讀物,還是其他需要語音輸出的場景,Azure TTS 都能為您提供便捷且專業的服務。
Pandrator 是一款先進的 AI 語音製作工具,能將文本、PDF、EPUB 和 SRT 文件轉換為多語言語音音檔。這個工具採用了 XTTS、Silero 和 VoiceCraft 等本地語音合成模型,支持語音克隆、LLM 預處理、RVC 增強及自動評估功能,滿足高品質語音製作需求。
Luvvoice 是一個免費的線上文字轉語音(TTS)工具,提供超過 70 種語言和 200 種不同的 AI 聲音選擇。使用者可以將文字轉換為自然的語音,並下載生成的音訊檔案為 MP3 格式。這款工具特別適合內容創作者、學生、播客製作人等,需要將文字朗讀成音訊的使用者。
Artlist 是專為影片創作者設計的綜合平台,提供高品質的數位資源,包括免版稅音樂、音效、AI 語音生成器、庫存影片、影片模板、插件及應用程式等。這些資源皆由頂尖藝術家創作,確保每項素材都具備專業水準。平台針對不同使用者需求設計多種方案,不論是個人創作者還是企業團隊,都能找到適合的訂閱計劃。此外,Artlist 也提供免費試用,讓使用者能夠先行體驗其豐富的資源庫。
ChatTTS是一個專為對話場景設計的文字轉語音模型。其主要應用包括大型語言模型助手的對話任務,以及影片介紹和教育培訓內容的語音合成。透過約10萬小時的中英文數據訓練,ChatTTS提供高品質、自然的語音合成。