
TRELLIS.2 是由 微軟研究院(Microsoft Research)發起、開源於 GitHub 的大型 3D 生成模型專案,全名為 Native and Compact Structured Latents for 3D Generation(結構化潛在空間的本地化與緊湊化用於 3D 生成)。它屬於前沿的 圖像/文本 → 高品質 3D 模型產生工具,可用於將 2D 圖像或其他提示快速轉為適用於遊戲、動畫、AR/VR 或虛擬製作中的逼真 3D 資產。
TRELLIS.2 是什麼?
TRELLIS.2 是下一代的 圖像到 3D 生成模型,其核心目標是:
-
從 2D 圖像生成高品質 3D 物件(含完整紋理與物理材質資訊)
-
處理任意形狀與拓撲結構(像開放表面、複雜結構都能穩定表現)
-
具備全套 PBR 紋理(Physical-based Rendering)輸出能力
-
高效且解析度可擴展(可生成高達 1536³ 細節的 3D 內容)
它是基於一種全新的 稀疏體素(sparse voxel)結構表示法——O-Voxel,搭配大型的 4B 參數生成網路(Flow Transformer 模型) 架構,使得輸出 3D 模型在細節、材質與幾何品質上比以往方法更穩定、準確、高解析。
核心功能與亮點
1. 從 2D 圖像 → 3D 資產
TRELLIS.2 可以把一張 2D 圖像轉化為具有實際立體結構與紋理的 3D 模型,並自動處理深度與視角細節,而不只是簡單的表面貼圖。
2. 原生 3D 表示與任意拓撲支持
它採用 O-Voxel 稀疏結構,這種表現方式能夠靈活處理非常複雜的形狀、開放曲面、非連續邊界等情況,而不像傳統 SDF 或 NeRF 方法會受限於拓撲與解析問題。
3. 高細節與真實感材質
生成的 3D 資產不只幾何精細,還支援完整的 物理基礎渲染(PBR)材質,包含顏色、粗糙度、金屬度等參數,對應真實光線行為。
4. 可擴展的解析度處理
從 512³ 到 1536³ 等不同解析度,模型在不同 GPU 下都能做高品質生成。GitHub
5. MIT 開源授權與研究社群支持
整個程式碼與模型授權採 MIT 開源授權,可用於研究、商業開發與進一步定製。
總結
TRELLIS.2 是一個先進的 AI 生成 3D 資產模型專案,由微軟開源並運用最新的稀疏體素與大型 Transformer 架構技術,能夠 從 2D 輸入快速生成高品質、可用於真實場景的 3D 資產。它的高解析度、真實材質支援以及 MIT 授權,使得它在 3D 創作與生成領域具有很高的研究價值和實際應用前景。