
這張圖是一張 「2025 年整體視訊/影像生成(Generative Video & Image)領域的趨勢時間軸總覽圖」,用 時間(2025 四個季度) × 廠商 的方式,整理各家 AI 公司在 影像生成、影片生成、剪輯、動畫與代理(Agent) 方面的重要進展與定位。
各家重點解讀
OpenAI
定位:標準制定者、品質天花板
-
Q2:GPT-4o Image Generation
-
對話式影像生成 + 實用編輯能力
-
開始「標準化」生成流程
-
-
Q3:Sora 2
-
多鏡頭、敘事、聲音全面進化
-
被形容為「世界震撼級」
-
-
Q4:GPT Image 1.5
-
文字理解、圖像編輯能力再升級
-
是否超越 Google 的 Nano Banana 成為焦點
-
重點:品質、理解力、敘事能力最強
定位:製作工具與流程革命
-
Flow + Veo 3
-
把 AI 視訊變成「真正可用的製作工具」
-
-
nano banana
-
解決長期困擾的「影像扭曲、穩定度」問題
-
-
nano banana pro
-
14 張參考圖、文字精準度暴增
-
-
Veo 3.1 / Imagen 4
-
持續微進化,偏向商業穩定輸出
-
重點:工作流、穩定性、可控性
Runway
定位:老牌創作者工具
-
Gen-4
-
動畫能力正式可用
-
-
Aleph
-
Inpainting、生成+編輯融合
-
-
Gen-4.5
-
是否仍能守住第一線地位?(圖中打了問號)
-
重點:創作友善,但壓力變大
Luma
定位:專業級
-
Ray3
-
Reasoning 型生成
-
原生 HDR
-
明確走「專業製作模式」
-
Vidu
定位:二次元動畫王者
-
Q1:Vidu Q1
-
超漂亮的 2D 動畫生成
-
-
Q2:Vidu Q2
-
角色、背景、動作一致性大幅提升
-
Hailuo
定位:物理與動作真實感
-
Hailuo 02
-
高物理精度
-
-
Hailuo Agent
-
劇本 → 生成 → 剪輯自動化
-
-
Hailuo 2.3
-
高品質「靈活移動」
-
Kling
定位:動作控制
-
Kling 2.1
-
動畫終於穩定
-
-
Kling 01 / 2.6
-
尤其 2.6:動作控制非常強
-
Higgsfield
定位:顛覆商業模式
-
Unlimited
-
多模型、無限使用
-
不綁模型、脫離模型競爭
-
-
Sketch to Video / Shots / Popcorn / Cinema Studio
-
一站式專業 UI,接近「AI 版剪輯公司」
-
AI 不再只是「生成」,而是「製作」
-
能剪、能修、能控、能重來
-
從 Demo → 商用
關鍵差異已不是「畫得漂不漂亮」
而是:
-
一致性
-
動作邏輯
-
可編輯性
-
流程自動化
2025 是「AI 影像工具分流」的一年
-
OpenAI:品質與敘事
-
Google:工具與流程
-
Runway / Luma:專業創作
-
Vidu:動畫
-
Hailuo / Kling:動作與物理
-
Higgsfield:商業模式創新