HY2.0采用混合專家架構,總參數406B,激活參數32B,支持256K上下文窗口,推理能力與效率居國内頂尖行列,且在文本創作與復雜指令遵循等實用場景上表現突出。
觀點網訊:12月5日,騰訊混元最新版語言模型Tencent HY 2.0 Think和Tencent HY 2.0 Instruct正式發布。
HY2.0采用混合專家架構,總參數406B,激活參數32B,支持256K上下文窗口,推理能力與效率居國内頂尖行列,且在文本創作與復雜指令遵循等實用場景上表現突出。
相比上一版本模型, HY2.0 Think顯著改進了預訓練數據和強化學習策略,在數學、科學、代碼、指令遵循等復雜推理場景的綜合表現穩居國内第一梯隊,泛化性大幅提升。
免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。
審校:
