百川智能發布千億級參數的大語言模型Baichuan3

科技 大模型 2024-01-29 13:39:26
百川智能推出參數超千億的大語言模型Baichuan3,采用創新技術提升性能30%以上,在多項評測中表現卓越,尤其醫療領域,成中文最佳大模型。

觀點網訊:1月29日,百川智能發布了超千億參數的大語言模型Baichuan3。該模型采用“動态數據選擇”、“重要度保持”及“異步CheckPoint存儲”等技術,顯著提升了性能,相較業界主流框架提升超過30%。其穩定訓練時間長達一個月以上,且故障恢復迅速,不超過10分鐘。在多項能力測評中,如CMMLU、GAOKAO、AGI-Eval以及數學和代碼專項評測MATH、HumanEval、MBPP等,Baichuan3均表現出色。

在醫療領域權威評測MCMLE、MedExam、CMExam中,它更成為中文醫療任務最佳大模型。Baichuan3通過“叠代式強化學習”技術,進一步增強了語義理解和生成能力。

免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。

審校:楊曉敏
返回