首頁資訊觀點指數品牌活動學徒計劃問答關于觀點

登錄投稿

頭條全時數據深度房地産資本金融商業地産商辦商場消費品牌物業服務産城物流住房租賃康養文旅科技生活方式

深度報告研究成果行業視角

博鰲房地産論壇繫列活動觀點年度論壇觀點商業年會觀點産業年會觀點物業大會觀點數字未來發展大會觀點資本圓桌觀點住房租賃大會
大灣區産業論壇長三角産業論壇西部産業科技大會觀點康養大會觀點商辦暨資管大會觀點購物中心暨零售消費峰會觀點ESG圓桌城市觀點論壇

學徒計劃企業課堂 (走進深業上城) 企業課堂 (走進復星星堡中環養老公寓) 企業課堂（走進西安高新區配套公司）企業課堂 (走進華為) 企業課堂 (走進廣州萬溪) 線上季海外遊學

紅杉中國正式開源AI基準測試xbench評測集

观点网 •

2025-06-18 09:36

紅杉中國6月18日開源AI基準測試工具xbench的兩個評測集xbench-ScienceQA和xbench-DeepSearch，采用動态更新機制和黑白盒評估方法，旨在解決大模型開發中的過拟合問題。該工具将為AI開發者提供長期有效的性能基準支持。

觀點網訊：6月18日，紅杉中國在中國正式開源其AI基準測試工具xbench的兩個評測集xbench-ScienceQA和xbench-DeepSearch，旨在服務大模型和AI Agent開發者，避免靜态評測集常見的過拟合問題，确保工具長期有效。

該開源舉措将基于AI發展動态更新評測集，采用“黑白盒”機制提升模型評估準确性。紅杉中國表示，這有助于推動AI技術創新，並為開發者提供可靠基準支持。

免責聲明：本文内容與數據由觀點根據公開信息整理，不構成投資建議，使用前請核實。

審校：楊曉敏

致信編輯打印

相關話題讨論

我要提問...

全時數據

專欄在線投稿+

王韶：金沙地産，我有自己的觀感!王韶

夏磊：影響土地市場的五大因素夏磊

楊光華：建議房産央國企 “賬期...楊光華

蔡記｜探索之旅· 嶺南溯源...蔡穗聲

馮毅成解讀全國兩會《政府工作報...馮毅成

你可能感興趣的話題

關注我們

移動端下載

版權聲明：觀點網絡信息科技有限公司及廣州觀點信息資訊服務有限公司擁有及保留其主辦暨承辦網站、論壇及活動的所有資料（包括但不限於文字、圖片、音頻、視頻資料及頁面設計、編排、軟件等）的所有權、版權等其他相關知識產權。除經授權合法使用上述資料外，未征得我司書面許可並付費，任何單位和個人不得以任何理由及方式使用上述資料（包括但不限於轉載、轉讓、授權他人使用等），否則我司將依法追究其法律責任以及賠償責任。

承印人：觀點網絡信息科技有限公司 (Guandian Network Information Technology Co.,Ltd.)
地址：香港灣仔菲林明道8號大同大廈15樓1505室（Room 5,15th Floor,Tai Tung Building,8 Fleming Road,Wan chai,HongKong Island,HongKong. ）
電郵：info@guandian.hk