京東宣布開源JoyAI-Echo長音視頻生成框架

觀點網

2026-06-04 07:41

  • 該框架引入智能“導演助理”DirectorAgent,並内置跨模态記憶庫,可在多鏡頭生成中持續保持角色外觀和說話人音色一致。

    觀點網訊:6月4日,京東正式開源JoyAI-Echo長音視頻生成框架,完整代碼及模型權重已在GitHub上線。

    據介紹,該框架引入智能“導演助理”DirectorAgent,並内置跨模态記憶庫,可在多鏡頭生成中持續保持角色外觀和說話人音色一致。通過DMD技術實現7.5倍推理加速,並支持對話式編輯功能,用戶無需重跑整條視頻即可修改鏡頭。

    根據公開資料整理,JoyAI-Echo直接解決了長視頻生成領域長期存在的“角色易崩、聲音亂變、生成緩慢”三大難題,使京東在長視頻生成領域進入全球第一梯隊。

    免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。

    審校:



    相關話題讨論



    你可能感興趣的話題

    AI

    科技