並在指令遵循(InstructionFollowing)這一關鍵能力上超越o3High、o4-MiniHigh、Gemini2.5pro等頂級閉源模型,位列全球第一。
觀點網訊:5月6日消息,國際權威大模型測評榜LiveBench公布了最新一期排名,阿里巴巴開源的新一代通義千問模型Qwen3獲全球開源模型冠軍,並在指令遵循(InstructionFollowing)這一關鍵能力上超越o3High、o4-MiniHigh、Gemini2.5pro等頂級閉源模型,位列全球第一。
據了解,LiveBench榜單由圖靈獎得主、Meta首席AI科學家楊立昆(YannLeCun)聯合紐約大學等機構推出,從數學、推理、編程、語言理解等多個復雜維度全面評估大模型。
因其采用動态更新的題庫,被譽為“全球首個無法作弊的模型基準測試”。
免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。
審校:徐耀輝