該框架是混元世界模型1.5的官方強化學習擴展模塊,專為長時序、交互式世界模型設計,可提升復雜組合動作場景交互準确率超35%。
觀點網訊:3月10日,騰訊混元3D團隊開源首個面向世界模型的強化學習後訓練框架“WorldCompass”。
據介紹,該框架是混元世界模型1.5的官方強化學習擴展模塊,專為長時序、交互式世界模型設計。如果說世界模型是引擎,那麼WorldCompass就是精準的“指南針”,通過引入強化學習機制,直接“引導”模型更準确地遵循用戶指令探索世界,並保持長時序的視覺一致性。
信息顯示,WorldCompass能顯著提升SOTA開源世界模型(WorldPlay)在復雜組合動作場景下的交互準确率超35%,相關代碼已面向全球開發者開源,支持對世界模型進行高效、可控的策略優化。
免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。
審校:
