標籤: Whisper 頁1

Whisper相關的文章,目前共收錄 5 篇內容。

Voice-Pro:整合字幕、翻譯及 TTS 的全方位解決方案
網路資源

Voice-Pro:整合字幕、翻譯及 TTS 的全方位解決方案

Voice-Pro 是一款專業語音轉錄、翻譯及語音合成解決方案,提供多語字幕添加、即時翻譯、背景音移除、字幕自動生成等功能,適合全球市場拓展及多語言支援。

MacWhisper:macOS 上的強大語音轉文字工具
網路資源

MacWhisper:macOS 上的強大語音轉文字工具

MacWhisper 是一款專為 macOS 開發的語音轉文字應用程式,利用 OpenAI 的 Whisper 技術進行高效的音訊轉錄。該應用程式支持多種音訊格式,包括 MP3、WAV、M4A、OGG、MOV 和 MP4。所有轉錄過程均在使用者設備上完成,確保數據的隱私和安全。MacWhisper 提供免費版和專業版,專業版具備批次處理、翻譯、ChatGPT 整合等進階功能。

WhisperSpeech:一套開源的文字轉語音系統
網路資源

WhisperSpeech:一套開源的文字轉語音系統

該系統透過對OpenAI的Whisper語音識別模型進行逆向工程來實現。經由這種逆向過程,WhisperSpeech能夠接受文字輸入,並利用經過改良的Whisper模型產生聽起來自然的語音輸出。

Insanely Fast Whisper:透過 Whisper API 的線上語音轉文字工具
網路資源

Insanely Fast Whisper:透過 Whisper API 的線上語音轉文字工具

Insanely Fast Whisper是基於OpenAI Whisper Large v3模型的高速音訊轉文字工具,能在不到98秒的時間內轉錄300分鐘(5小時)的音訊。適用於處理長時間的會議錄音、訪談音訊等各種應用場景。此工具還支援翻譯功能,您可以在示範頁面上體驗其強大的轉換速度。

fal.ai:提供 Stable Diffusion 等眾多生成式 AI 模型的雲端 API 服務平台
網路資源

fal.ai:提供 Stable Diffusion 等眾多生成式 AI 模型的雲端 API 服務平台

fal.ai 是一個可以提供 AI 模型服務的雲端 API 平台,在上面目前有諸如 Stable Diffusion with LoRAs、Stable Diffusion XL、Whisper、AnimateDiff…等知名 AI 模型可以使用。