阿里通義開源Fun-CosyVoice3-0.5B模型,提供zero-shot音色克隆能力,僅需3秒參考音頻即可復刻音色並合成新語音,同時支持本地部署與二次開發。
觀點網訊:12月15日,阿里通義宣布開源Fun-CosyVoice3-0.5B模型,該版本具備zero-shot音色克隆能力,用戶只需提供一段3秒以上的參考音頻,即可復刻其音色並合成新語音,同時支持本地部署與二次開發。
此外,通義同步推出輕量化版本Fun-ASR-Nano模型,總參數量壓縮至0.8億,推理成本更低,現已開源,支持本地部署與定制化微調。
免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。
審校:楊曉敏
