目前,該模型已正式上架華為雲大模型即服務平台MaaS,為企業及開發者提供模型體驗和API服務。
觀點網訊:9月29日,DeepSeek-V3.2-Exp模型正式發布並開源,模型引入稀疏Attention架構。
華為雲第一時間完成對DeepSeek-V3.2-Exp模型的适配工作,最大可支持160K長序列上下文長度。
目前,該模型已正式上架華為雲大模型即服務平台MaaS,為企業及開發者提供模型體驗和API服務。
華為雲ModelArts推理平台基于CloudMatrix384超節點,為DeepSeek-V3.2-Exp模型提供穩定、高可靠的推理服務。ModelArts推理平台能夠根據實際負載需求,按需供給和分配模型推理算力資源,實現資源分時復用與靈活擴縮容。針對DeepSeek-V3.2-Exp模型,此次仍沿用大EP並行方案部署,基于稀疏Attention結構疊加實現長序列親和的上下文並行策略,並兼顧模型時延和吞吐性能。
免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。
審校:
