WonderJourney:透過一張圖片讓 AI 生成連續場景的動畫

這是一個由史丹佛大學和谷歌合作開發的專案。

它能夠根據使用者提供的文字描述或圖片,自動生成一系列3D場景的連續畫面。

這些場景不僅多樣化,而且彼此之間還能緊密衔接,形成一種虛擬的「奇妙旅程」場景。而且你只需要輸入一段描述或上傳一張圖片即可...

主要功能特點:

與之前專注於單一場景類型的視圖生成工作不同,WonderJourney從任何使用者提供的位置(通過文本描述或圖像)開始,生成一系列多樣化但連貫相連的3D場景。

1、從任意位置出發:使用者可以通過提供一段文字描述或一張圖片來指定一個起始點。基於這個起始點WonderJourney將生成一系列3D場景。
例如,如果使用者上傳一張森林的圖片或描述一個城市景觀,WonderJourney會從這個場景開始,創造一連串與之相關的3D場景。
2、長時間的「奇妙之旅」:WonderJourney能夠生成不僅多樣化而且持續較長時間的3D場景序列。
使用者可以體驗一段長時間的虛擬旅程,其中場景會連續不斷地變化,提供豐富的視覺體驗。
3、多樣化的目的地:即使從同一個起始點出發,WonderJourney也能生成通往不同「目的地」的多條「奇妙之旅」。
例如,從同一張森林圖片出發,一條旅程可能以山脈為終點,而另一條可能以海灘結束,展現出不同的場景和風格。
4、受控的「奇妙之旅」:使用者可以通過提供一系列文本描述(如詩歌、俳句或故事摘要)來指導生成的旅程。
這允許使用者創造更具個性和主題性的旅程。例如,根據一首詩的情感和意象,生成一系列與之相相符的場景。


工作原理:

該框架利用大型語言模型(LLM)生成場景的文本描述,一個由文本驅動的點雲生成管道來製作引人入勝且連貫的3D場景序列,以及一個視覺語言模型(VLM)來驗證生成的場景。

1、場景描述生成:使用大型語言模型(LLM)自動生成場景描述。根據使用者輸入的文本或圖像,LLM提供場景的語義和概念描述。
2、文本驅動的視覺場景生成:根據LLM生成的場景描述,使用文本驅動的視覺場景生成模塊創建3D場景。該模塊將文本描述轉換為彩色點雲,形成3D場景。
3、視覺驗證:使用視覺語言模型(VLM)對生成的場景進行檢查。確保場景沒有不希望的視覺效果,如視覺上的錯誤或不連貫性。
4、連貫性和多樣性:生成的3D場景在視覺上連貫,同時在風格和類型上多樣化。形成一種連續的視覺旅程,模擬在一個虛擬「奇妙世界」中的體驗。

課程推薦

AI工作術全面學習實戰營:6 堂精選課程,學會最好用 AI 工具,翻轉你的人生

AI工作術全面學習實戰營:6 堂精選課程,學會最好用 AI 工具,翻轉你的人生

《PChome雜誌》攜手 5 位在 AI 領域的專業講師,打造上述 6 堂實用課程,教你學會時下最好用的 AI 工具,導入生成式 AI 來產製工作內容,改造並升級你的工作流程。

輸入折扣碼 ZERO2024 還可以額外獲得 NT$400 優惠喔。

HTML與SEO實戰應用—並以ChatGPT助力提升網站品質與流量

HTML與SEO實戰應用—並以ChatGPT助力提升網站品質與流量

本課程專為希望深入了解 HTML 並有效結合 SEO 策略的學員設計。我們將重點放在 HTML 的深度學習與應用上,同時穿插介紹如何透過搜索引擎優化提升網站能見度。透過即時互動式的直播教學,加上 ChatGPT 的輔助,您將學習到如何建立一個結構優良、美觀且符合 SEO 標準的網站。這不僅會提升網站的用戶體驗,還會大幅提高網站的搜索引擎排名,進而增加訪客流量和潛在客戶。
用AI強化職場競爭力 ChatGPT、Midjourney從入門到精通

用AI強化職場競爭力 ChatGPT、Midjourney從入門到精通

在快速變遷的職場中,提升競爭力成為關鍵。透過引領潮流的AI技術,ChatGPT和Midjourney將助您勇攀高峰。無論您是AI新手還是專家,這個課程將引導您從入門到精通,解密AI的奧秘,並學習如何運用於職場。
GitHub Copilot AI 程式碼編輯工具應用實務班

GitHub Copilot AI 程式碼編輯工具應用實務班

讓學員瞭解有效地使用該工具來加速開發流程、提高程式碼品質和生產力。課程重點放在以 JavaScript 程式語言為例,介紹 Copilot 的基本原理、使用方法和最佳實踐。

輸入折扣碼 TC1456JA 還可以額外獲得 NT$500 優惠喔。

ChatGPT X Clipchamp AI 生成影片、配音與字幕應用實戰班

ChatGPT X Clipchamp AI 生成影片、配音與字幕應用實戰班

掌握Clipchamp AI的操作技巧,靈活運用Clipchamp AI進行影片編輯和創作,實現創意表達和傳播目的。

輸入折扣碼 TC1451JAN 還可以額外獲得 NT$500 優惠喔。

如何串接多種數位工具資訊?Looker Studio 資料視覺化實戰班|GoogleAds x FB廣告 x GA流量數據

如何串接多種數位工具資訊?Looker Studio 資料視覺化實戰班|GoogleAds x FB廣告 x GA流量數據

Looker Studio除了可協助使用者監控網站流量、廣告成效、選擇匯入資源的管道之外,還可以將數據資料多平台整合、數據報表即時更新、數據範本可重複套用的效益,透過自動化系統,將數據全部匯入同一個報表平台,是企業不可或缺的重要工具。

輸入折扣碼 TC1270JIA 還可以額外獲得 NT$500 優惠喔。

和我們交流

加入我們的社群,裡面會有一些技術的內容、有趣的技術梗,以及職缺的分享,歡迎和我們一起討論。