標籤: HuggingFace 頁1

HuggingFace相關的文章,目前共收錄 8 篇內容。

NVIDIA PersonaPlex:開源全雙工語音新紀元,打造零停頓的真正 AI 對話
網路資源

NVIDIA PersonaPlex:開源全雙工語音新紀元,打造零停頓的真正 AI 對話

語音 AI 終於像真人了!NVIDIA 震撼開源 PersonaPlex-7B-V1,全球首款免費「全雙工」語音模型。告別對講機式的等待,它支援隨時打斷與零延遲流暢對話。想在本地端部署具備靈魂的即時 AI 伴侶?立即前往 Hugging Face 下載,體驗這場打破次元壁的技術革命!

Qwen Image Edit 2511 — 3D Camera Control:用 AI 一次產出物件的 3D 視角畫面的強大工具
網路資源

Qwen Image Edit 2511 — 3D Camera Control:用 AI 一次產出物件的 3D 視角畫面的強大工具

這個 3D Camera Control 讓你可以直接拉鏡頭,精準控制 AI 生圖角度與構圖,不再靠提示詞抽卡,快速生成正面、側面、俯視等視角畫面。

Qwen Image Edit Angles:輕鬆用 AI 讓圖片改變視角
網路資源

Qwen Image Edit Angles:輕鬆用 AI 讓圖片改變視角

透過 Qwen Image Edit-Angles,輕鬆將圖片變換視角,生成多角度變體,適用於設計、3D 建模、產品展示等多元應用。

MTEB Leaderboard:嵌入模型全方位評比與排行榜,方便選出適合的嵌入模型
網路資源

MTEB Leaderboard:嵌入模型全方位評比與排行榜,方便選出適合的嵌入模型

MTEB(Massive Text Embedding Benchmark)提供多任務跨語言文字嵌入模型評比,協助選擇最適合應用場景的模型,支援 112 種語言與 8 類任務。

FlowiseAI:簡化大語言模型應用的視覺化開源工具
網路資源

FlowiseAI:簡化大語言模型應用的視覺化開源工具

FlowiseAI 是一款開源的視覺化 LLM 工具,提供零程式碼流程設計、即時預覽與多模型支持,適用於聊天機器人、內容創作與數據處理等多場景,助力高效開發與部署 AI 解決方案。

Bolt DIY:開源 LLM 框架,打造你的專屬 AI 工具
網路資源

Bolt DIY:開源 LLM 框架,打造你的專屬 AI 工具

Bolt DIY 是一款開源框架,專為整合多種大語言模型(LLM)設計,支援 OpenAI、Anthropic、HuggingFace 等,具備靈活擴展性與強大社群支持,助力開發者高效打造 AI 驅動應用。

OpenAI Text-To-Speech API with Gradio:使用 OpenAI 的文字轉語音服務
網路資源

OpenAI Text-To-Speech API with Gradio:使用 OpenAI 的文字轉語音服務

OpenAI TTS New(OpenAI Text-To-Speech API with Gradio)是一個體驗 OpenAI 新版文字轉語音的在線生成工具,不過需要自備 OpenAI API Key,目前支援7種聲音和兩種模型,文字轉語音工具支持調節語速,而且支持下載文字轉語音後的 mp3 格式的文件,感興趣的朋友可以到網站學習體驗。

MusicGen:由 Meta 開發的免費 AI 音樂生成工具
網路資源

MusicGen:由 Meta 開發的免費 AI 音樂生成工具

MusicGen是由Meta開發的AI音樂生成工具,可以從簡單的文字提示中生成高質量的音樂樣本,並具有上傳音頻片段以獲得額外指導的功能。MusicGen相比之前的AI音樂生成器有所提升,這要歸功於其創新的方法,例如使用單階段的Transformer語言模型,而不是將多個模型結合在一起。您可以將這個工具安裝在自己的機器上,或者在HuggingFace上查看 Demo 版本。要在您的機器上安裝MusicGen,請按照GitHub repository上找到的安裝指南進行操作。