基于阿里最新開源的Qwen3-32B模型 DeepSWE開源AI Agent登頂榜首

科技 AI 2025-07-03 09:30:37
Together.ai與Agentica合作開源AI代理框架DeepSWE,基于阿里巴巴Qwen3-32B模型開發,在SWE-Bench測試中Pass@1準确率達42.2%,混合測試擴展後提升至59%,超越所有開源框架。該框架采用強化學習訓練,支持64k上下文長度和100環境步驟,展現復雜任務處理優勢。

觀點網訊:7月3日,Together.ai與Agentica合作開源創新AI代理框架DeepSWE,該框架基于阿里巴巴新近開源的Qwen3-32B模型,完全通過強化學習訓練開發,旨在提升人工智能代理的性能和效率。

DeepSWE在SWE-Bench-Verified測試中表現突出,Pass@1準确率達42.2%(16次運行平均),使用混合測試時擴展(TTS)後躍升至59%,超越所有開源代理框架位居榜首。

免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。

審校:
返回