邱躍鵬還透露,在推理加速方面,騰訊雲向DeepSeek、vLLM、SGLang等開源社區提交多項優化技術,並自研開源FlexKV多級緩存技術,顯著降低KVCache占用,使首字時延最多下降70%。
觀點網訊:9月16日,據騰訊集團副總裁、騰訊雲總裁邱躍鵬透露,目前,騰訊雲已在推理加速、AgentInfra和國際化布局等方面取得突破,騰訊雲正不斷升級雲基礎設施,以支撐Agent規模化落地和企業全球化發展。
邱躍鵬還透露,在推理加速方面,騰訊雲向DeepSeek、vLLM、SGLang等開源社區提交多項優化技術,並自研開源FlexKV多級緩存技術,顯著降低KVCache占用,使首字時延最多下降70%。針對Agent大規模應用,騰訊雲推出AgentRuntime解決方案,集成執行引擎、雲沙箱和安全可觀測等五大能力,提供穩定運行環境。其中,雲沙箱基于自研技術,啟動時間僅100毫秒,可支持數十萬實例並發。
免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。
審校:
