阿里千問3.6-Plus在全球知名大模型盲測榜單LMArena旗下Code Arena公布的新一期排名中位列全球第二,超越OpenAI、Google、xAI等國際巨頭,成為該榜單上排名最高的中國大模型。
觀點網訊:4月3日,全球知名大模型盲測榜單LMArena旗下聚焦AI編程能力的Code Arena公布新一期排名,阿里巴巴最新一代大語言模型Qwen 3.6-Plus登上全球榜單第二,超越OpenAI、Google、xAI等國際巨頭,成為該榜單上排名最高的中國大模型。
根據公開資料整理,Qwen3.6-Plus在智能體編程SWE-bench繫列評測及真實世界智能體任務Claw-Eval等權威評測中,編程表現超越2倍乃至3倍參數量的GLM-5、Kimi-K2.5等模型,接近全球最強編程模型Claude繫列。該模型具備原生多模态理解和推理能力,現已通過阿里雲百煉API開放調用。
據介紹,本次更新聚焦于開發者核心訴求,顯著提升模型的智能體編程能力,在前端頁面生成、代碼修復、終端自動化等場景中表現出更穩定的任務執行能力,模型默認支持100萬上下文窗口。
免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。
審校:
