觀點網訊:1月29日,百川智能發布了超千億參數的大語言模型Baichuan3。該模型采用“動态數據選擇”、“重要度保持”及“異步CheckPoint存儲”等技術,顯著提升了性能,相較業界主流框架提升超過30%。其穩定訓練時間長達一個月以上,且故障恢復迅速,不超過10分鐘。在多項能力測評中,如CMMLU、GAOKAO、AGI-Eval以及數學和代碼專項評測MATH、HumanEval、MBPP等,Baichuan3均表現出色。
在醫療領域權威評測MCMLE、MedExam、CMExam中,它更成為中文醫療任務最佳大模型。Baichuan3通過“叠代式強化學習”技術,進一步增強了語義理解和生成能力。
免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。