2026-02-13 14:45
阿里巴巴(中國)有限公司申請公布。
觀點網訊:2月13日,阿里巴巴(中國)有限公司申請公布"一種基于思維鍊訓練大型語言模型的方法、裝置和設備"專利。專利摘要顯示,該方法通過獲取多個初始采樣數據生成思維鍊數據集合,對基礎大型語言模型進行全量微調,叠代生成中間思維鍊數據,並采用組相對策略優化算法GRPO對中間大型語言模型進行強化學習,最終确定目標大型語言模型。該技術方案可提高大型語言模型的可解釋性和審核精度。
免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。
審校:
科技
大模型