小米開源首個原生端到端語音大模型——Xiaomi-MiMo-Audio

观点网

2025-09-19 10:05

  • 該模型基于創新預訓練架構和上億小時訓練數據,首次在語音領域實現基于ICL的少樣本泛化,並在預訓練觀察到明顯的“涌現”行為。

    觀點網訊:9月19日,小米集團宣布開源首個原生端到端語音大模型Xiaomi-MiMo-Audio。該模型采用創新預訓練架構,訓練數據規模達上億小時,首次在語音領域實現基于ICL(In-Context Learning)的少樣本泛化能力。

    據了解,Xiaomi-MiMo-Audio在預訓練階段已觀察到明顯的“涌現”行為,標志着語音大模型技術取得關鍵突破。小米表示,此次開源旨在推動語音AI生态發展,降低開發者使用門檻。

    免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。

    審校:



    相關話題讨論



    你可能感興趣的話題

    大模型

    科技