華為雲:第一時間完成DeepSeek-V3.2-Exp模型适配工作

观点网

2025-09-29 23:08

  • 目前,該模型已正式上架華為雲大模型即服務平台MaaS,為企業及開發者提供模型體驗和API服務。

    觀點網訊:9月29日,DeepSeek-V3.2-Exp模型正式發布並開源,模型引入稀疏Attention架構。

    華為雲第一時間完成對DeepSeek-V3.2-Exp模型的适配工作,最大可支持160K長序列上下文長度。

    目前,該模型已正式上架華為雲大模型即服務平台MaaS,為企業及開發者提供模型體驗和API服務。

    華為雲ModelArts推理平台基于CloudMatrix384超節點,為DeepSeek-V3.2-Exp模型提供穩定、高可靠的推理服務。ModelArts推理平台能夠根據實際負載需求,按需供給和分配模型推理算力資源,實現資源分時復用與靈活擴縮容。針對DeepSeek-V3.2-Exp模型,此次仍沿用大EP並行方案部署,基于稀疏Attention結構疊加實現長序列親和的上下文並行策略,並兼顧模型時延和吞吐性能。

    免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。

    審校:



    相關話題讨論



    你可能感興趣的話題

    科技

    大模型

    合作

    AI