新模型核心亮點(灰度測試):上下文能力躍升:從128K Token提升至1M Token,意味着一次可處理的信息量激增近10倍。
觀點網訊:2月11日,據媒體報道,DeepSeek新模型上線。
報道稱,新模型核心亮點(灰度測試):上下文能力躍升:從128K Token提升至1M Token,意味着一次可處理的信息量激增近10倍。
此外,知識截止日期更新至2025年5月(原為2024年7月)。
報道稱,這不僅是一次微調,更可能意味着基于更近期數據訓練的全新基礎模型。
免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。
審校:
