智元具身研究中心推出SOP在線後訓練繫統,四機並行3小時成功率達92.5%,疊衣服吞吐量提升114%,36小時連續作業穩定性驗證通過。
觀點網訊:1月6日,智元具身研究中心發布SOP(Scalable Online Post-training)框架,首次将在線學習、分布式架構與多任務通才性引入物理世界VLA後訓練,實現機器人集群在真實環境中分鐘級模型同步更新。
根據公開資料整理,SOP采用Actor-Learner異步架構,多機器人並行采集數據並上傳雲端,動态調整在線/離線數據比例,3小時内使商超場景綜合性能提升33%,靈巧操作任務成功率普遍升至94%以上,其中紙盒裝配達98%。實驗顯示,四機集群訓練速度為單機2.4倍,有效避免過拟合,36小時連續作業驗證繫統魯棒性。
免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。
審校:楊曉敏
