WhisperSpeech：一套開源的文字轉語音系統

網址

https://replicate.com/lucataco/whisperspeech-small

2024-01-24 09:42:53

該系統透過對OpenAI的Whisper語音識別模型進行逆向工程來實現。

經由這種逆向過程，WhisperSpeech能夠接受文字輸入，並利用經過改良的Whisper模型產生聽起來自然的語音輸出。

輸出的語音在發音準確度與自然度上均表現出色。

WhisperSpeech 項目的路線圖：

聲學標記提取：改善聲學標記的提取過程。
語義標記提取：利用Whisper模型生成並量化語義標記。
S->A 模型轉換：開發將語義標記轉換為聲學標記的模型。
T->S 模型轉換：實現從文字標記到語義標記的轉換。
提升EnCodec語音品質：優化EnCodec模型以提高語音合成品質。
短句推理優化：增強系統處理短句的能力。
擴展情感語音資料集：收集更大規模的情感語音數據。
文件化LibriLight資料集：在HuggingFace上詳細記錄資料集。
多語言語音收集：集結社群資源，收集多種語言的語音。
訓練多語言模型：開發支援多種語言的文字轉語音模型。

網站

HueHive：利用 ChatGPT 生成調色盤的 AI 工具 Aspen：AI 整合的超高速 API 測試工具

課程推薦

用 AI 生成網站？ AI 高效網站設計實戰課：ChatGPT X HTML X SEO

利用 AI 提升網站設計效率與 SEO 排名！了解如何透過 ChatGPT 等工具快速建立 HTML 架構，優化關鍵字與用戶體驗，讓網站更具競爭力。

輸入折扣碼 TC1533SL 還可以額外獲得 NT$500 優惠喔。

AI工作術全面學習實戰營：6 堂精選課程，學會最好用 AI 工具，翻轉你的人生

《PChome雜誌》攜手 5 位在 AI 領域的專業講師，打造上述 6 堂實用課程，教你學會時下最好用的 AI 工具，導入生成式 AI 來產製工作內容，改造並升級你的工作流程。

輸入折扣碼 ZERO2024 還可以額外獲得 NT$400 優惠喔。

HTML與SEO實戰應用—並以ChatGPT助力提升網站品質與流量

本課程專為希望深入了解 HTML 並有效結合 SEO 策略的學員設計。我們將重點放在 HTML 的深度學習與應用上，同時穿插介紹如何透過搜索引擎優化提升網站能見度。透過即時互動式的直播教學，加上 ChatGPT 的輔助，您將學習到如何建立一個結構優良、美觀且符合 SEO 標準的網站。這不僅會提升網站的用戶體驗，還會大幅提高網站的搜索引擎排名，進而增加訪客流量和潛在客戶。