螞蟻百靈團隊透露,此為首次嘗試萬億思考模型,未來将持續改進。用戶可通過HuggingFace、魔搭社區下載,並在螞蟻百寶箱等平台在線體驗。
觀點網訊:10月14日,螞蟻集團正式發布並開源萬億參數思考模型Ring-1T,全面開放模型權重及訓練配方,旨在通過大規模可驗證獎勵強化學習訓練提升自然語言推理能力。
該模型基于9月30日開源的預覽版Ring-1T-preview,利用RLHF訓練優化通用性能,在多項任務榜單中表現更均衡。螞蟻百靈團隊透露,此為首次嘗試萬億思考模型,未來将持續改進。用戶可通過HuggingFace、魔搭社區下載,並在螞蟻百寶箱等平台在線體驗。
免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。
審校:
