美團推出輕量化MoE模型LongCat-Flash-Lite,擁有685億參數,依托YARN技術支持最長256K上下文。
觀點網訊:2月6日,美團發布輕量化MoE模型LongCat-Flash-Lite。
根據公開資料整理,該模型擁有685億參數,每次推理僅激活29億~45億參數,通過将超300億參數高效用于嵌入層,在智能體與代碼領域表現突出,且依托YARN技術支持最長256K上下文,可高效處理長文檔、大規模代碼分析等場景。
據了解,LongCat-Flash-Lite不僅超越了參數量等效的MoE基線模型,還在與同規模現有模型的對比中展現出卓越競争力。
免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。
審校:楊曉敏
