阿里雲開源推出20B參數圖像生成模型Qwen-Image,采用MMDiT架構提升文本渲染與圖像編輯精度。作為通義千問繫列首個圖像基礎模型,其開源特性将加速AI技術研發與産業落地。
觀點網訊:8月5日,通義千問在中國開源推出首個圖像生成基礎模型Qwen-Image。該模型采用20B參數的MMDiT架構,旨在通過開源方式提升復雜文本渲染和精确圖像編輯能力。
作為通義千問繫列中的首個圖像生成基礎模型,Qwen-Image在精确圖像編輯和復雜文本渲染方面取得顯著進展。其開源特性有望加速AI技術的研究與行業應用。
免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。
審校:
