Matrix-Game 2.0 發佈:首個用於即時長序列生成的開源互動世界模型

(SeaPRwire) –   新加坡,2025年8月11日 — Skywork AI於8月12日宣布發布Matrix-Game 2.0,這是其Matrix系列互動世界模型的升級版本。這款突破性模型能夠在通用場景下提供即時、長序列的互動視訊生成,且該模型完全開源,使其成為業界首創。

Matrix-Game 2.0在即時性能和長序列生成能力方面都取得了重大飛躍。該模型專注於低延遲和高幀率,能夠在複雜環境中穩定地以25 FPS生成連續視訊,持續時間可達數分鐘。這顯著增強了連貫性、可用性和沉浸感。

除了更快的推斷速度,Matrix-Game 2.0還能精確理解物理和場景語義。用戶可以發出簡單命令,即時自由探索、操縱和構建結構一致、視覺豐富且邏輯合理的虛擬環境。這項突破消除了內容生成與互動參與之間的障礙,為虛擬人類、遊戲引擎、具身AI等應用開闢了新的可能性。

模型架構
Matrix-Game 2.0引入了一種全新的視覺驅動互動世界建模方法—擺脫了對語言提示的依賴,轉而專注於空間理解和基於物理的學習。

  • 3D Causal VAE Compression: 有效壓縮空間和時間維度,以實現更好的建模和生成。
  • Multimodal Diffusion Transformer (DiT): 將視覺編碼與用戶動作命令結合,以逐幀生成逼真的動態序列。
  • User Interaction Module: 調整 GameFactory 和 Genie-style 框架以實現即時控制。

即時自迴歸視訊生成
Matrix-Game 2.0採用自強制訓練策略,利用新穎的自迴歸擴散生成機制來克服傳統模型的延遲和錯誤累積:

  • Causal Diffusion Model Distillation: 通過依賴過去幀來最小化序列延遲。
  • Distribution Matching Distillation (DMD): 對齊訓練和推斷分佈以獲得更穩定的結果。
  • KV Cache Mechanism: 實現無縫長視訊生成,無需冗餘計算,在單一GPU上支持25 FPS無限輸出長度。

應用與性能
Matrix-Game 2.0支援透過鍵盤和滑鼠輸入進行動態、物理一致的互動—例如角色移動和攝影機旋轉。它適用於各種場景,包括GTA-style環境、Minecraft和開放世界探索,具有增強的跨領域適應性和物理真實感。

三大核心突破:

  1. 高幀率即時長序列生成:以25 FPS實現長達數分鐘的自然且反應靈敏的互動。
  1. 多場景泛化:適用於各種風格和環境,從城市景觀到藝術渲染。
  1. 增強的物理一致性:在複雜地形上實現逼真的移動,提升沉浸感和可控性。

Matrix-Game 2.0為空間智能研究和應用樹立了新的里程碑,為具身AI訓練、虛擬世界快速建構以及影視和元宇宙的內容創作鋪平了道路。

開源連結:

  • 技術報告:
  • 專案頁面:
  • HuggingFace:
  • GitHub:

是一個面向消費者的AI工作區和創意平台,幫助日常用戶在數分鐘內製作幻燈片、試算表、視訊、文件和互動內容——圍繞直觀的對話式工作流程構建。該平台提供引導式提示、即時預覽以及與常用辦公工具的整合,以加速學生、自由職業者和小型團隊的工作流程。該平台可在網路和行動裝置上使用,強調易用性、可負擔性和快速迭代——將先進的AI創意工具直接帶給消費者。

本文由第三方廠商內容提供者提供。SeaPRwire (https://www.seaprwire.com/)對此不作任何保證或陳述。

分類: 頭條新聞,日常新聞

SeaPRwire為公司和機構提供全球新聞稿發佈,覆蓋超過6,500個媒體庫、86,000名編輯和記者,以及350萬以上終端桌面和手機App。SeaPRwire支持英、日、德、韓、法、俄、印尼、馬來、越南、中文等多種語言新聞稿發佈。

聯絡人:Peter Tian
Skywork AI PTE.LTD.
peter (at) skywork.ai