Kokoro TTS 是一個由 Hugging Face 社群成員 hexgrad 開發的開源文字轉語音(Text-to-Speech, TTS)模型,擁有僅 8,200 萬參數,專注於高效能與高品質的語音合成。
主要特色:
-
多語言支援: Kokoro TTS 支援包括英語、法語、日語、韓語和中文在內的五種語言,滿足不同語言使用者的需求。
-
高效能: 儘管模型參數僅有 8,200 萬,Kokoro TTS 在 TTS 領域表現出色,展示了小型模型在語音合成中的潛力。
-
開源與可擴展性: Kokoro TTS 以 Apache 2.0 授權釋出,開發者可以自由使用、修改和擴展,並可透過 Hugging Face 平台上的多個專案進行試驗和應用。
你可以在 Hugging Face 上體驗,只要輸入想要轉換的內容,在選擇語言就能夠把文字內容轉換成語音。
總體而言,Kokoro TTS 是一個高效且靈活的文字轉語音模型,適合需要多語言支援和高品質語音合成的開發者和研究人員。