觀點網訊:6月1g日,MiniMax M3模型正式上線,京東雲JoyBuilder模型開發平台已第一時間接入該模型並同步開放服務。
據介紹,京東雲結合自研推理框架,采用PD分離部署、KV Cache緩存及投機采樣等推理優化技術,旨在顯著提升模型推理吞吐與響應效率。
免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。