DeepSeek已決定使用華為的人工智能芯片來訓練其部分模型,反映其正在減少對英偉達芯片的依賴。
觀點網訊:8月29日,據媒體報道,DeepSeek已決定使用華為的人工智能芯片來訓練其部分模型,反映其正在減少對英偉達芯片的依賴。
據此前報道,DeepSeek近日發布了DeepSeek-V3.1。
DeepSeek方面稱,本次升級包含以下主要變化:混合推理架構讓一個模型同時支持思考模式與非思考模式;相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短時間内給出答案,讓模型擁有更高的思考效率;通過Post-Training優化,讓新模型有更強的Agent能力,在工具使用與智能體任務中的表現有較大提升。
據悉,DeepSeek-V3.1采用了UE8MO FP8 Scale參數精度,該模型與UE8M0FP8動态範圍大,提升穩定性與效率,适配華為昇騰等芯片。
免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。
審校:
