文字轉語音相關的文章,目前共收錄 16 篇內容。
SoniTranslate 是一款開源影片翻譯工具,專為將影片和音訊轉換成多語言設計,結合 TTS 技術實現精準同步音訊。支援 Gradio 庫的互動介面,操作簡單,適合企業國際化、教育影片和娛樂字幕翻譯。支持自訂語音色調,為內容本地化和多語分享提供便捷方案。
Podcastfy Demo 是一個開源專案,利用語音合成技術自動將文字轉換為 Podcast,支援多語言、多語音選擇及 RSS 發佈,適合內容創作者、教育機構和企業使用。
Voice-Pro 是一款專業語音轉錄、翻譯及語音合成解決方案,提供多語字幕添加、即時翻譯、背景音移除、字幕自動生成等功能,適合全球市場拓展及多語言支援。
PDF2Audio 是由麻省理工學院 (MIT) 的 LAMM 開發的一款開源工具,專門將 PDF 文件轉換成音訊檔案,讓使用者能夠透過聆聽方式來瀏覽和吸收文件內容。無論是學術論文、電子書、工作報告,PDF2Audio 都能快速將其轉換為音訊,方便使用者在通勤、運動等情境下有效地「聽取」資訊,提升學習與工作的效率。
Azure TTS 是一個免費的線上文字轉語音(Text-to-Speech, TTS)工具,專為使用者提供高品質的語音合成功能。這個平台支援多種語言和聲音選項,無論是用於創作影片、製作有聲讀物,還是其他需要語音輸出的場景,Azure TTS 都能為您提供便捷且專業的服務。
Pandrator 是一款先進的 AI 語音製作工具,能將文本、PDF、EPUB 和 SRT 文件轉換為多語言語音音檔。這個工具採用了 XTTS、Silero 和 VoiceCraft 等本地語音合成模型,支持語音克隆、LLM 預處理、RVC 增強及自動評估功能,滿足高品質語音製作需求。
Luvvoice 是一個免費的線上文字轉語音(TTS)工具,提供超過 70 種語言和 200 種不同的 AI 聲音選擇。使用者可以將文字轉換為自然的語音,並下載生成的音訊檔案為 MP3 格式。這款工具特別適合內容創作者、學生、播客製作人等,需要將文字朗讀成音訊的使用者。
Artlist 是專為影片創作者設計的綜合平台,提供高品質的數位資源,包括免版稅音樂、音效、AI 語音生成器、庫存影片、影片模板、插件及應用程式等。這些資源皆由頂尖藝術家創作,確保每項素材都具備專業水準。平台針對不同使用者需求設計多種方案,不論是個人創作者還是企業團隊,都能找到適合的訂閱計劃。此外,Artlist 也提供免費試用,讓使用者能夠先行體驗其豐富的資源庫。
ChatTTS是一個專為對話場景設計的文字轉語音模型。其主要應用包括大型語言模型助手的對話任務,以及影片介紹和教育培訓內容的語音合成。透過約10萬小時的中英文數據訓練,ChatTTS提供高品質、自然的語音合成。
Parler TTS 是基於Dan Lyth與Simon King的研究成果而釋出的開源文字轉語音模型。此模型支援用戶自定語音風格,如性別、音調及說話風格等,生成自然流暢的語音。所有資料、預處理、訓練程式碼和權重均公開,以便於開發者使用和修改。適用於教育、廣播及個人化閱讀助手等多種應用,是一款高效且易於整合的語音解決方案。
Verbatik 是一個功能強大的文字轉語音 API,它能即時將文字轉換成自然的語音,支援高達 142 種語言,提供超過 600 種人工智慧語音。這個 API 讓使用者可以全面定製語音屬性,並提供商業使用授權。
利用文字轉語音(TTS)功能,可以朗讀任何 Google 文件、PDF、網頁或含有文字的書籍。提供 30 多種語言和 130 種語音的自然發音。
TTSMaker 是一款免費文字轉語音工具,提供語音合成服務,支援多種語言,包括英語、法語、德語、西班牙語、阿拉伯語、中文、日語、韓語等,擁有160+種聲音選擇,適用於自媒體、有聲書、教育等多種場景。特色包括二次元語音、OpenAI技術支援、行動裝置優化、音軌翻譯及背景音樂合成,完全免費無限制使用。可用於大聲朗讀文本和電子書,是一款優秀的免費TTS工具,能輕鬆將文字轉換為語音。
OpenAI TTS New(OpenAI Text-To-Speech API with Gradio)是一個體驗 OpenAI 新版文字轉語音的在線生成工具,不過需要自備 OpenAI API Key,目前支援7種聲音和兩種模型,文字轉語音工具支持調節語速,而且支持下載文字轉語音後的 mp3 格式的文件,感興趣的朋友可以到網站學習體驗。
Voice Remaker 是線上AI語音生成器和優質的合成聲音來產生逼真的文字轉語音(TTS)音訊工具。將文字即時轉換為自然聲音,並下載為MP3檔案。