11月3日,阿里雲旗下通義千問推出Qwen3-Max-Thinking早期預覽版,模型在AIME25與HMMT25數學推理基準測試中實現100%準确率,目前仍在持續訓練優化。
觀點網訊:11月4日,阿里雲通義千問團隊發布Qwen3-Max-Thinking推理模型早期預覽版。
根據公開資料整理,該版本雖處于持續訓練階段,但當前Checkpoint在結合工具調用與規模化測試時計算後,已在AIME25、HMMT25兩項高難度數學推理基準測試中取得100%準确率。
通義千問方面透露,Qwen3-Max繫列将聚焦復雜邏輯與數學任務,後續會通過叠代更新進一步提升泛化能力。
免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。
審校:楊曉敏
