北京小米機器人技術有限公司一項名為“機器人控制方法、繫統、裝置、設備和介質”的專利近日獲授權,通過視覺語言模型與擴散模型融合技術,提升機器人對自然語言指令的理解與執行能力。
觀點網訊:近日,北京小米機器人技術有限公司申請的“機器人控制方法、繫統、裝置、設備和介質”專利獲授權。
該專利通過經過訓練的目標視覺語言模型,基于用戶指令對任務場景進行視覺分析,生成任務清單,並利用擴散模型确定對應的機械運動軌迹,從而實現對機器人的高精度操作控制。
據介紹,該技術融合視覺編碼器、視覺語言對齊層及大語言模型,顯著提升了機器人對自然語言的理解能力、任務場景适應能力、控制精度與靈活性,以及用戶指令達成度。
免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。
審校:楊曉敏
