阿里将于2月16日除夕夜開源Qwen3.5大模型,該模型實現架構創新,並計劃推出2B密集模型與35B-A3B MoE模型。
觀點網訊:2月16日,報道援引消息人士消息,阿里巴巴将于今晚除夕夜開源新一代千問大模型Qwen3.5,該模型實現了模型架構的全面創新。去年除夕深夜,阿里曾發布Qwen2.5-Max。
Qwen3.5采用創新混合注意力機制,結合局部與全局注意力優勢,長文本處理能力提升超40%。該模型原生支持任意分辨率圖像輸入,並計劃以雙版本形式開源,包括2B密集模型和35B-A3B MoE模型,旨在降低開發者部署門檻。
免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。
審校:
