HappyHorse-1.0在文生視頻評測中Elo得分達1357分,超越字節跳動Seedance 2.0等競品,在文本轉視頻和圖像轉視頻(無音頻)類别中排名第一,帶音頻類别中位居第二。
觀點網訊:4月9日,市場消息顯示,阿里巴巴集團已匿名發布一款名為HappyHorse-1.0的新型人工智能視頻生成模型。
該模型由淘天集團未來生活實驗室開發,在沒有發布會及官方背書的情況下,悄然登頂全球知名AI評測平台Artificial Analysis的Video Arena榜首。
根據公開資料,HappyHorse-1.0在文生視頻評測中Elo得分達1357分,超越字節跳動Seedance 2.0等競品,在文本轉視頻和圖像轉視頻(無音頻)類别中排名第一,帶音頻類别中位居第二。
據介紹,該模型參數量為150億,采用40層單流自注意力Transformer架構,原生支持音視頻同步生成,無需後期配音及口型對齊。
模型采用DMD-2蒸餾技術,在單張H100顯卡上生成1080p視頻僅需約38秒,支持英語、普通話、粵語、日語、韓語、德語和法語七種語言,已于4月9日正式宣布開源。
免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。
審校:
