商湯發布日日新5.0大模型 對標GPT-4Turbo

观点网

2024-04-23 15:46

  • 商湯科技于4月23日在北京發布人工智能大模型日日新5.0,采用MOE架構,訓練數據超10TB,推理窗口達200K,旨在對標GPT-4Turbo。

    觀點網訊:4月23日,商湯科技在中國北京舉行新品發布會,正式發布人工智能大模型“日日新5.0”。

    該模型采用了先進的MOE(Mixture of Experts)混合專家架構,並基于超過10TB的數據tokens進行深度學習訓練。此外,日日新5.0大模型還擁有高達200K的推理上下文窗口。

    據悉,日日新5.0大模型的開發旨在全面對標OpenAI的GPT-4Turbo。

    審校:徐耀輝



    相關話題讨論



    你可能感興趣的話題

    大模型

    科技

    AI

    商湯