阿里通義千問發布小尺寸模型Qwen3-4B

观点网

2025-08-07 10:17

  • 8月7日,阿里通義千問發布Qwen3-4B-Instruct-2507與Qwen3-4B-Thinking-2507,前者非推理性能超越閉源GPT4.1-Nano,後者推理能力接近30B級模型,已在魔搭社區及HuggingFace開源。

    觀點網訊:8月7日,中國阿里巴巴集團旗下的通義千問團隊正式發布兩款4B參數級小尺寸大模型——Qwen3-4B-Instruct-2507與Qwen3-4B-Thinking-2507,並同步在魔搭社區與HuggingFace平台開源。

    通義千問官方表示,在非推理任務中,Qwen3-4B-Instruct-2507全面超越閉源的GPT4.1-Nano;在推理任務中,Qwen3-4B-Thinking-2507的表現已可媲美中等規模的Qwen3-30B-A3B(thinking)。兩款模型均基于2025年7月版本訓練,旨在為開發者提供輕量級、高性能的AI解決方案。

    免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。

    審校:楊曉敏



    相關話題讨論



    你可能感興趣的話題

    大模型

    科技