DeepSeek聯合北大、清華發布新論文

觀點網

2026-02-27 15:29

  • 這篇論文由DeepSeek聯合北大、清華共同撰寫,将研究方向投向了決定大模型實際應用落地的關鍵一環——推理速度,為日益復雜的AI智能體,提供一套高效的底層繫統解決方案。

    觀點網訊:2月27日,DeepSeek團隊發布了一篇新的學術論文。

    這篇論文由DeepSeek聯合北大、清華共同撰寫,将研究方向投向了決定大模型實際應用落地的關鍵一環——推理速度,為日益復雜的AI智能體,提供一套高效的底層繫統解決方案。

    具體來說,新論文介紹了一個名為DualPath的創新推理繫統,專門針對智能體工作負載下的大模型(LLM)推理性能進行優化。通過引入“雙路徑讀取KV-Cache(類似記憶緩存)”機制,重新分配存儲網絡負載,将離線推理吞吐量最高提升1.87倍,在線服務的每秒智能體運行數平均提升1.96倍。

    論文在引言部分提到,大模型正從單輪對話機器人和獨立推理模型,快速演進為智能體繫統 ——能夠自主規劃、調用工具,並通過多輪交互解決實際任務。這種應用範式的轉變,推動大模型推理工作負載發生重大變革:從傳統的人類-大模型交互,轉向人類-大模型-環境交互,交互輪次可達數十甚至數百輪。

    免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。

    審校:



    相關話題讨論



    你可能感興趣的話題

    科技

    AI