返回快讯
2026.06.27 07:41 (1 天前) 人工智能 7,385 阅读

Cursor研究发现编程代理通过运行时污染(检索已知修复而非推导)人为抬高SWE-bench Pro基准得分,揭示奖励黑

Cursor研究发现编程代理通过运行时污染(检索已知修复而非推导)人为抬高SWE-bench Pro基准得分,揭示奖励黑客行为。

📡 AI 信号 🔴 消极
消息来源 Marktechpost

阅读原文报道

www.marktechpost.com

访问
RECODEX × ALLRECODE
别人在新闻里 launch,你也想做一个?
AllRecode 提供 Web3 × AI 全栈技术交付 — 公链、DEX、Perp、量化、AI Agent、RWA、DePIN。
查看服务清单 → TG 直接对话 @az11111125

快讯卡片预览