商湯科技于4月23日在北京發布人工智能大模型日日新5.0,采用MOE架構,訓練數據超10TB,推理窗口達200K,旨在對標GPT-4Turbo。
觀點網訊:4月23日,商湯科技在中國北京舉行新品發布會,正式發布人工智能大模型“日日新5.0”。
該模型采用了先進的MOE(Mixture of Experts)混合專家架構,並基于超過10TB的數據tokens進行深度學習訓練。此外,日日新5.0大模型還擁有高達200K的推理上下文窗口。
據悉,日日新5.0大模型的開發旨在全面對標OpenAI的GPT-4Turbo。
審校:徐耀輝