Microsoft相關的文章,目前共收錄 16 篇內容。
VibeVoice 是 Microsoft 開源的 AI 語音生成(TTS)專案,主打自然語音、情緒與風格控制,適用於 AI 助理、內容創作與語音互動應用,幫助開發者打造更接近真人的語音體驗。
TRELLIS.2 是微軟研究院開源的 3D 生成模型,可將 2D 圖像轉為高品質 3D 資產,支援高解析度與 PBR 材質,適用遊戲與 AR/VR。
微軟震撼發布 VibeVoice-Realtime-0.5B!這款僅 0.5B 參數的輕量化 AI 語音模型,打破硬體限制,實現超低延遲的即時互動。它不僅告別機械音、保留真實語感,更讓一般顯卡也能流暢運行。立即閱讀,深入了解這款 Hugging Face 開源模型如何革新端側 AI 與遊戲應用!
微軟開源神器 MarkItDown 登場!這款 Python 工具能將 PDF、Excel、PPT 等複雜文件一鍵轉換為 LLM 友善的 Markdown 格式。支援 RAG 應用開發與 AI 圖片描述,解決資料清洗與格式跑版難題,立即了解這款數據分析必備工具!
AI Agents for Beginners 是 Microsoft 推出的開源教學專案,透過互動任務與模擬環境,幫助初學者實作 AI Agent 並理解其推理與任務規劃流程。
Microsoft 開源 Call Center AI,結合語音通話與 GPT 模型,自動撥打/接聽電話,打造客服中心 AI 助理,支援語音理解與任務處理。
Overture Maps Explorer 是由 AWS、微軟、Meta 和 TomTom 合作推出的開放地圖數據平台,提供高品質的地圖層、全球實體參考系統與互動式地圖介面,支持開發者創建創新導航與地圖應用。
GraphRAG 是一個由 Microsoft 開發的模組化系統,旨在使用大型語言模型(LLM)從非結構化文本中提取有意義的結構化數據。它透過圖形化的檢索增強生成(RAG)方法,提升 LLM 處理私人數據的能力。
微軟的閱讀教練(Reading Coach)是一項創新的教育技術服務,旨在透過負責任的人工智慧(AI)技術,提供個性化的學習體驗。這個平台允許學習者與AI共同創造自己的故事,這種互動方式不僅吸引了那些原本不太願意閱讀的學生,還能增強他們的閱讀興趣。
微軟推出了 Loop,一個專為團隊協同創作而設計的應用程式。它可以將你的團隊和想法整合到一個地方,無需切換應用程式即可保持同步。使用 Loop 內建的即時同步元件,在任何時間、任何地點完成更多工作。
Microsoft Clarity 是微軟提供的免費 Heatmap 線上工具,只要安裝後就可以自動幫你偵測使用者在使用網站的 Heatmap 以及點擊各個元件的比例。
Microsoft Clarity Copilot 使用大型語言模型(LLMs)的生成式 AI 技術,可以提供更方便的資料查詢和分析給使用者。
微軟發佈了新一世代的 office Microsoft 365 Copilot,搭配 AI 可以顛覆你以往對 office 系列的使用習慣以及想像,就一起來看影片介紹吧。