影音生成類 AI 工具,目前共收錄 55 種服務。
Parler TTS 是基於Dan Lyth與Simon King的研究成果而釋出的開源文字轉語音模型。此模型支援用戶自定語音風格,如性別、音調及說話風格等,生成自然流暢的語音。所有資料、預處理、訓練程式碼和權重均公開,以便於開發者使用和修改。適用於教育、廣播及個人化閱讀助手等多種應用,是一款高效且易於整合的語音解決方案。
VoiceAILabs 是一個AI名人語音生成器,提供專業的AI名人語音合成服務,讓你能夠輕鬆免費製作個性化語音內容,效果不滿意可重新生成,支援常見語言,是最佳的AI語音生成工具。
RecCloud AI Video Generator 能將文字或圖片轉換成影片。它採用先進的AI模型如Sora,讓用戶能夠創造出細節近乎真實世界的驚人影片。此工具簡化了影片製作過程,無需複雜的攝影和編輯步驟,用戶可迅速將創意轉化為影片,且最長可達一分鐘。適用於廣告、教育、專業影視等多種場景,並支援商業用途。
Sora AI Video Generator是一款利用OpenAI最新的Sora AI模型,將文字內容轉化為影片的網路應用程式。用戶僅需描述他們想要創建的影片,Sora便能根據這些描述生成令人難以置信的AI影片,為內容創作者提供了一種全新且高效的方式來製作視覺內容。無論是用於社交媒體、教育還是娛樂,Sora都開啟了無限的可能性。
THE FABLE STUDIO 能在短短幾分鐘內將任何文字轉變成栩栩如生的動畫故事。透過 AI 驅動的視覺效果、配音和音樂,您可以創造故事,不需具備寫作或繪畫的技巧。重新編寫電影情節,重新構想結局,釋放您的想像力!
Stability AI 近期引發廣泛討論,他們的新項目 Stable Video 的官方網站已經正式上線,象徵著影片創作領域的一大進步。Stable Video 提供了一個獨特的平台,讓使用者透過上傳圖片或輸入文字提示來生成高品質影片,這種創新的方式極大地簡化了影片製作的過程。
該系統透過對OpenAI的Whisper語音識別模型進行逆向工程來實現。 經由這種逆向過程,WhisperSpeech能夠接受文字輸入,並利用經過改良的Whisper模型產生聽起來自然的語音輸出。
Moonvalley(YC W21)是一個優秀的文字轉影片生成AI模型,讓您能夠輕鬆創建令人驚嘆的動畫,生成的影片涵蓋各種風格,從超逼真的影片到動漫,應有盡有。想嘗試的可以在其 Discord 上免費試用 Beta 版本。
這是一個由史丹佛大學和谷歌合作開發的專案。 它能夠根據使用者提供的文字描述或圖片,自動生成一系列3D場景的連續畫面。 這些場景不僅多樣化,而且彼此之間還能緊密衔接,形成一種虛擬的「奇妙旅程」場景。而且你只需要輸入一段描述或上傳一張圖片即可...
Real-ESRGAN-Video 是一個可以把透過 AI 把影片解析度提升到 2K 或 4k 的服務,只需上傳一段影片,選擇您想要的清晰度,如全高清(FHD)、2K 或 4K。系統會自動提升影片的品質。處理完的影片可以直接在網頁上預覽,也可以下載到電腦上。
OpenAI TTS New(OpenAI Text-To-Speech API with Gradio)是一個體驗 OpenAI 新版文字轉語音的在線生成工具,不過需要自備 OpenAI API Key,目前支援7種聲音和兩種模型,文字轉語音工具支持調節語速,而且支持下載文字轉語音後的 mp3 格式的文件,感興趣的朋友可以到網站學習體驗。
Video Prompt AI 是您進入由人工智慧驅動的影片製作領域的門戶,它能輕鬆協助您打造引人入勝的敘事,利用 AI 生成的視覺元素和語音整合,節省時間,加速創意構想的過程。
VideoMyListing 是一款能夠運用人工智慧製作免費影片的工具,協助您在 TikTok 和 YouTube 上行銷您的 Airbnb 房源!VideoMyListing 會掃描您的房源資訊,生成腳本,並為您製作影片!此外,它還提供一個簡潔的編輯界面,方便您進行微調。
CREATUS.AI 是一款免費的基於人工智慧的文字轉影片應用,它是您的內容創作夥伴!將文字轉換為影片,為社交媒體內容帶來無限可能——帖子、推文、有聲照片、短影片和更多!
VoiceGenie是一個沉浸式生成式人工智慧語音機器人,適用於銷售、支援等多個領域。它能夠進行互動、人性化的多語言對話,並且適用於呼入和呼出電話。VoiceGenie由Oriserve提供支援,Oriserve是一家經驗豐富的行業領導者,擁有超過5年的經驗,並被谷歌評為第一 Conversational AI。
Reals是一款運用人工智能即時創建專業級影片的工具。您只需提供劇本或提示詞,從100多位主持人和影片模板中選擇,輕鬆快速地製作專業品質的影片。您還可以將影片即時翻譯為任何語言,並添加自己的內容和品牌。
Respeecher Marketplace 是一個專為內容創作者提供的人工智慧語音庫,可以讓您使用他人的聲音進行敘述,同時保留情感、音量和重音。不論您是電影製片人、遊戲開發者、配音演員還是YouTuber,您都可以從庫中選擇任何聲音,甚至進行語音本地化,使用不同的口音。
Text2Video-Zero 是一個零樣本文字到影片合成框架,它使用預先訓練好的文字轉圖像模型,實現了低成本、高品質且一致的影片生成,而且不需要對影片進行訓練或優化!Text2Video-Zero 還可以自然地支援預先訓練好的文字轉圖像模型的擴充工作,例如 Instruct Pix2Pix、ControlNet 和 DreamBooth,並提供 Video Instruct Pix2Pix、Pose Conditional、Edge Conditional 和 Edge Conditional and DreamBooth 專業應用。