該模型基于DeepSeek-V3.2-Exp-Base構建,通過LLM驗證器自動審查生成的數學證明,並利用高難度樣本持續優化性能。
觀點網訊:11月27日,DeepSeek發布可自驗證數學推理模型DeepSeekMath-V2,代碼與權重同步開源至Hugging Face及GitHub。
新模型基于DeepSeek-V3.2-Exp-Base構建,通過内置LLM驗證器自動審查數學證明,並持續用高難度樣本優化。公開測試顯示,其在IMO 2025與CMO 2024均達金牌水平,Putnam 2024獲118/120分,團隊稱該框架為構建可靠數學智能繫統提供新路徑。
免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。
審校:
