騰訊混元開源首個面向世界模型的強化學習後訓練框架WorldCompass

觀點網

2026-03-10 17:35

  • 該框架是混元世界模型1.5的官方強化學習擴展模塊,專為長時序、交互式世界模型設計,可提升復雜組合動作場景交互準确率超35%。

    觀點網訊:3月10日,騰訊混元3D團隊開源首個面向世界模型的強化學習後訓練框架“WorldCompass”。

    據介紹,該框架是混元世界模型1.5的官方強化學習擴展模塊,專為長時序、交互式世界模型設計。如果說世界模型是引擎,那麼WorldCompass就是精準的“指南針”,通過引入強化學習機制,直接“引導”模型更準确地遵循用戶指令探索世界,並保持長時序的視覺一致性。

    信息顯示,WorldCompass能顯著提升SOTA開源世界模型(WorldPlay)在復雜組合動作場景下的交互準确率超35%,相關代碼已面向全球開發者開源,支持對世界模型進行高效、可控的策略優化。

    免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。

    審校:



    相關話題讨論



    你可能感興趣的話題

    AI

    科技