12:15 · 2026年3月31日 · 周二 Harness 决定 Agent 上限:从代码执行到项目迭代via V2EX - 技术 (author: autojunjie) Telegraph Harness 决定 Agent 上限:从代码执行到项目迭代 Harness 决定 Agent 上限:从代码执行到项目迭代 同一个模型,不同的 Harness ,SWE-bench 上差了 17 题。当模型能力趋于同质化,真正决定 AI Agent 表现上限的,不是它有多聪明,而是它被放在什么样的环境里工作。 TL;DR 2026 年,AI 工程领域达成了一个共识:Harness 比模型重要。Claude Code 、Codex 、Cursor 已经为 agent 构建了成熟的代码执行 harness 。但当 agent 从"写一个函数"升级到"做一个项目",它还…