標籤: Whisper 頁1

Whisper相關的文章,目前共收錄 4 篇內容。

WhisperSpeech:一套開源的文字轉語音系統
網路資源

WhisperSpeech:一套開源的文字轉語音系統

該系統透過對OpenAI的Whisper語音識別模型進行逆向工程來實現。經由這種逆向過程,WhisperSpeech能夠接受文字輸入,並利用經過改良的Whisper模型產生聽起來自然的語音輸出。

Insanely Fast Whisper:透過 Whisper API 的線上語音轉文字工具
網路資源

Insanely Fast Whisper:透過 Whisper API 的線上語音轉文字工具

Insanely Fast Whisper是基於OpenAI Whisper Large v3模型的高速音訊轉文字工具,能在不到98秒的時間內轉錄300分鐘(5小時)的音訊。適用於處理長時間的會議錄音、訪談音訊等各種應用場景。此工具還支援翻譯功能,您可以在示範頁面上體驗其強大的轉換速度。

fal.ai:提供 Stable Diffusion 等眾多生成式 AI 模型的雲端 API 服務平台
網路資源

fal.ai:提供 Stable Diffusion 等眾多生成式 AI 模型的雲端 API 服務平台

fal.ai 是一個可以提供 AI 模型服務的雲端 API 平台,在上面目前有諸如 Stable Diffusion with LoRAs、Stable Diffusion XL、Whisper、AnimateDiff…等知名 AI 模型可以使用。

MacWhisper- 讓 AI 幫你把語音檔轉成逐字稿
網路資源

MacWhisper- 讓 AI 幫你把語音檔轉成逐字稿

MacWhisper 是一個基於 OpenAI Whisper API 的逐字稿語音轉換文字工具,支援上傳 mp3、wav、m4a 跟 mp4 的格式,有免費版和付費版。