Claude Code 的意义远不止于编码:它是一种通用型 AI 代理,而且已经是相当出色的知识型工作者
本文信息来源:transformernews

在假期期间,这条消息如野火般迅速传开。圣诞树下的礼物被忽略了——取而代之的是,整个 AI 世界集体坐下来试用 Claude Code,而且几乎无一例外地被震撼到了。
“作为一名程序员,我从未感觉自己这么落后过……显然有人分发了一种强大的外星工具,却没有任何使用手册,” 说 AI 传奇人物 Andrej Karpathy。“我只给了 Claude Code 一个问题的描述,它在一小时内生成了我们去年才构建出来的东西,” 说 Google 高级工程师 Jaana Dogan。无论你看向哪里,氛围都一模一样:搭载 Opus 4.5 的 Claude Code 是一次游戏规则的改变者。
对于非程序员——政策制定者、记者以及更广泛的知识工作者——来说,听到这些很容易耸耸肩。“AI 会写代码”听起来像是只影响软件工程师的进展,而不是影响我们其他人。当你的工作不涉及 GitHub 仓库或终端窗口时,一个更好的编程助手似乎是别人的问题。
这忽略了一个至关重要的点。当人们听到“coding”时,往往会把它想象成某个专业领域所需的一项专门技能。他们不会联想到预订剧院门票、分析电子表格或处理发票。但这些全部都是通过软件完成的任务——这也意味着,对于一个能够编写并执行代码的 AI 来说,这些任务都可以完成。事实上,在过去两周里,这些任务 Claude Code 都为我完成过。
归根到底,Code 只是我们用来指示电脑做事情的一种语言。因此,一个能够写代码的 AI agent,几乎可以……完成你在电脑上做的所有事情。问题不在于“这算不算一个 coding 任务?”,而在于“这件事能不能以数字方式完成?”如果答案是肯定的,那么 Claude Code 很有可能就能完成。
理解这一点至关重要,因为这正是为什么 Claude Code 的影响对象是每一个人,而不仅仅是那些已经被它惊艳到的开发者。Claude Code 并不只是为工程师生成代码、供其审核和部署。 它是通过代码来完成任务的。它名字里的“Code”其实具有误导性,低估了这个产品的真实形态:一个通用型 AI agent,几乎可以在你的电脑上完成任何事情。
结合“Claude in Chrome”扩展(它让 Claude Code 可以控制你的浏览器),最终效果就像随时听命于你的一个非常聪明的通才智能体,24/7 不间断——永不疲倦、从不厌烦,并且几乎可以在远少于人类所需时间的一小部分内完成你提出的任何事情。
我完全没有任何编程经验。但在过去两周里,我让 Claude Code 浏览了我的银行对账单和发票,为我的报税准备了一份初稿。(它全部都做对了。)我让它帮我预订剧院门票:它查看了我的日历,浏览了剧院的网站来确认余票情况,并选择了一个既有充足余票又符合我行程安排的日期。它为我构建了一系列自动化工具,整体上将为 Transformer 团队每周节省大约半天的工作时间。它还为即将到来的度假规划了一份详细的行程,包括从我最喜欢的网红的 Instagram 精选内容中提取数百条餐厅推荐。
我让它重新格式化过电子表格、生成过详细的研究报告,也帮我写文章(包括这篇)。它为我打造了一个漂亮的全新个人网站、一个用于浏览 Audible 的定制仪表盘,以及一个将 Letterboxd 同步到我个人笔记应用的脚本。这样的例子还可以一直列下去,一直,一直。
一个极其智能的模型(Opus 4.5),再加上让它能够自主运行、维持一种伪记忆并执行指令的胸背带(Claude Code),以及对浏览器的完全控制(Chrome 中的 Claude),三者的结合,造就了真正强大的存在。从非常重要的意义上来说,Claude Code 就是一名知识工作者。
是的,它更接近于“上班第一天的聪明新人”,而不是“已经干了几十年的专家”。但我愿意打赌,即便如此,它仍然可以完成你工作中相当大的一部分。
这是 AI 领域的一次范式级飞跃。此前被广泛预言的 AI “代理化”时代已不再停留在理论层面。METR 估计 ,Opus 4.5 有时可以完成原本需要人类将近五个小时才能完成的任务。我在自己的工作中也观察到了类似的,甚至是更令人印象深刻的成果。
然而,尽管具备强大的能力,Claude Code 及其最接近的竞争对手 OpenAI 的 Codex,在目前形态下很可能还无法进入主流。与 ChatGPT 不同,它们存在着显著的使用门槛:你需要懂得如何使用终端 ,并且能够熟练运用少量基础命令。这并不困难 ,但对新手而言足够令人望而生畏,从而构成实际问题。在这种门槛存在的情况下,它看起来像是一个“双层经济体”的雏形。学会使用 Claude Code 的人,其生产力将呈指数级提升;而其他人则会困惑,为什么自己被远远甩在了后面。
但你不应指望这种差距会持续太久。解决可访问性挑战本质上是一个用户体验(UX)问题,而且相对并不复杂。Anthropic 及其竞争对手已经开始构建让底层技术更易于使用的界面——例如 Claude for Excel。而且由于 Claude Code 正在编写其自身的大部分代码 ,其能力很可能以惊人的速度不断提升。
最后一点或许是最关键的。因为尽管 Claude Code 的通才能力令人印象深刻,真正的提升将来自它的编码技能——具体来说,是它自动化自身研究与开发的能力。
这种情况已经开始出现。12 月 27 日,Claude Code 的首席开发者 Boris Cherny 表示 :“在过去三十天里,我对 Claude Code 的 100% 贡献都是由 Claude Code 编写的”——新增了 4 万行代码。接下来的几个月里,我们应该预期 Claude Code 已经相当惊人的能力将以极快的速度提升——而这些改进在很大程度上将来自系统本身。
我敢肯定,很多人在读到这段话时都会翻白眼。科技界早已习惯从宽泛的角度看待代码,将其视为让电脑做几乎任何它所能做之事的能力。对其他人来说,编程能力真正所能带来的广阔空间仍然显得有些遥远。归根结底,正如大家所说,真正能够“感受到 AGI”的唯一真实方式,或许就是亲自去尝试一下。
如果你这样做,我怀疑你会得出和我类似的结论。Claude Code 还不是 AGI。但这是我第一次在直觉上强烈地感受到,真正具有变革性的能力已经近在咫尺。长期支撑着大量 AI 政策辩论的那些假设——大规模失业、灾难性风险、我们所熟知的知识工作的终结——如今不再只是空洞的假设。问题已不再是 AI 是否会改造知识工作,而是当这一切发生时,除了少数技术精英之外,是否还有人会注意到。