SEED-Story 是由騰訊 ARC 團隊開發的創新工具,旨在生成多模態長篇故事。該工具利用大型語言模型(MLLM)來生成包含豐富敘述文字和一致風格圖像的故事。
主要功能
- 多模態生成:根據用戶提供的初始圖像和文字,生成連貫的故事。
- StoryStream 數據集:專門設計的大規模數據集,用於訓練和測試多模態故事生成。
- 角色圖生成:透過提供角色圖,生成一連串連貫的圖片,豐富故事的視覺效果。
- 開源資源:提供預訓練模型、推理程式碼和訓練程式碼,方便用戶進行二次開發。
使用 SEED-Story,可以輕鬆生成多模態的長篇故事,從而豐富內容創作。其開源的特性也讓開發者能夠靈活地調整和優化模型,提升生成品質。角色圖生成功能特別適合需要一致性視覺表現的故事創作。