8月7日,阿里通義千問發布Qwen3-4B-Instruct-2507與Qwen3-4B-Thinking-2507,前者非推理性能超越閉源GPT4.1-Nano,後者推理能力接近30B級模型,已在魔搭社區及HuggingFace開源。
觀點網訊:8月7日,中國阿里巴巴集團旗下的通義千問團隊正式發布兩款4B參數級小尺寸大模型——Qwen3-4B-Instruct-2507與Qwen3-4B-Thinking-2507,並同步在魔搭社區與HuggingFace平台開源。
通義千問官方表示,在非推理任務中,Qwen3-4B-Instruct-2507全面超越閉源的GPT4.1-Nano;在推理任務中,Qwen3-4B-Thinking-2507的表現已可媲美中等規模的Qwen3-30B-A3B(thinking)。兩款模型均基于2025年7月版本訓練,旨在為開發者提供輕量級、高性能的AI解決方案。
免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。
審校:楊曉敏
