返回首页
信息来源:shumer.dev 2026.02.11 22:56 约 19 分钟 AI 1.2万 阅读

有大事情正在发生

What Will Be the Next Big Thing in AI?

回想一下2020年2月。

如果你当时很留意,可能会注意到有人在谈论海外传播的一种病毒。但大多数人并没有特别留意。股市表现很好,孩子们在学校,你去餐馆、握手、计划旅行。如果有人告诉你他们在囤积卫生纸,你会以为他们在互联网上某个奇怪角落待太久了。然后,在大约三周的时间里,整个世界改变了。你的办公室关闭了,孩子们回到家里,生活被重新安排成了一个如果你在一个月前向自己描述,自己都不会相信的样子。

我认为我们正处于“一切看起来被夸大了”的阶段,而这背后其实是比新冠大得多的事情。

我花了六年时间创建一家人工智能初创公司并在这一领域投资。我生活在这个世界里。我写这篇文章是为了那些不在其中的人——我的家人、朋友、我关心的人,他们不断问我“人工智能到底怎么回事?”,而我给出的回答往往无法说明实际正在发生的事情。我一直给他们委婉的版本、社交场合能说的版本。因为诚实的版本听上去像是我疯了。有一段时间,我告诉自己仅凭这个理由就足以把真实情况藏在心里。但我所说的与实际发生的之间的差距已经太大了。我在乎的人值得知道即将到来的变化,即便听起来很疯狂。

我要先说明一件事:尽管我从事人工智能工作,但对即将发生的事情几乎没有影响力,行业中绝大多数人也没有。未来正被极少数人塑造:几百名研究员在少数几家公司……OpenAI、Anthropic、Google DeepMind 以及其他几家。一次由小团队在几个月内完成的训练运行,就可能产出一个改变整个人工智能技术走向的系统。我们大多数人工智能从业者都是在我们没有奠定的基础上继续构建。我们看着这一切的展开,和你们一样……只是我们恰好离震源更近,先感受到了地动。

但现在是时候了。不是那种“总有一天我们应该讨论这个”的说法。而是“这件事正在发生,我需要你们明白它”的紧迫语气。


我知道这是真的,因为它首先发生在我身上。

外界尚未完全理解的一点是:行业中许多人之所以现在拉响警报,是因为这已经发生在我们自己身上。我们不是在做预测。我们在告诉你,这些事情已经在我们的工作中发生过,并警告你,下一个就是你。

多年来,人工智能一直在稳步进步。时有大跃进,但每次大跃进之间间隔足够长,你可以随着进展逐步适应。然后在2025年,构建这些模型的新技术解锁了更快的进步节奏。接着又更快了,然后再更快。每一个新模型不仅比上一个更好……而且差距越拉越大,新模型发布之间的时间也越来越短。我越来越多地使用人工智能,来回交互越来越少,看着它处理那些我曾认为需要我专业知识的事情。

然后,在 2 月 5 日,两家主要的人工智能实验室在同一天发布了新模型:OpenAI 的 GPT-5.3 Codex,以及 Anthropic(Claude 的开发者,Claude 是 ChatGPT 的主要竞争者之一)的 Opus 4.6。随后发生了一种觉醒。不是像开关一按就亮……更像是你意识到周围的水位一直在上升,现在已经到了胸口的那一刻。

我在实际技术工作上已不再被需要。 我用简明的英语描述我想要的东西,然后它就……出现了。不是需要我修正的草稿,而是成品。我告诉人工智能我的需求,离开电脑四个小时,回来时发现工作已完成。完成得很好,甚至比我自己做得更好,无需任何修改。几个月前我还在与人工智能来来回回地指导、修改。现在我只需描述结果然后离开。

我举个例子,让你明白这在实践中到底是什么样子。我会对人工智能说:“我要构建这个应用。它应该做什么、大致应该长什么样由这里开始。帮我设计用户流程、界面设计以及一切细节。”它就照做了。它写了数万行代码。然后——这一点在一年前还是不可想象的——它自己打开了应用 。它点击各个按钮。它测试功能。像人一样使用这个应用。如果它不喜欢某个外观或交互,它会回去自行修改。它像开发者一样迭代,修复并完善,直到满意为止。只有当它认为应用达到了它自己的标准,才会回到我这里说:“可以让你来测试了。”而我一测试,通常就是完美的。

我没有夸张。这就是我这周星期一的实际情况。

但真正震撼我的是上周发布的那个模型(GPT-5.3 Codex)。它不只是执行我的指令。它在做出智能决策。它拥有一种感觉,第一次像是具有判断 。像是具有品味 。那种无法用言语解释的、知道正确选择是什么的感觉,人们常说人工智能永远不会拥有的东西。这个模型拥有它,或者至少接近到使得二者之间的区别开始变得无关紧要。

我一直很早就开始采用人工智能工具。但过去几个月让我大为震惊。这些新的人工智能模型并不是渐进式改进。这完全是另一种事物。

即便你不从事科技行业,这对你也很重要,原因如下。

AI 实验室做了一个有意识的选择。他们首先把重点放在让人工智能擅长写代码上……因为构建人工智能本身需要大量代码。如果人工智能能写出这些代码,它就能帮助构建它的下一个版本。一个更聪明的版本,写出更好的代码,进而构建一个更聪明的版本。让人工智能精通编程是解锁一切的策略。这就是为什么他们先做这件事。我的工作之所以比你的更早开始改变,并不是因为他们以软件工程师为目标……只是他们首先瞄准的方向带来的副作用。

他们现在已经做到了。接下来要扩展到其它所有领域。

过去一年里,科技工作者经历的——看到人工智能从“有用的工具”变成“比我做得更好”——将是其他所有人即将经历的。法律、金融、医疗、会计、咨询、写作、设计、分析、客户服务。不是十年后。这些系统的构建者说是一到五年。有些人说更短。根据我在过去几个月看到的情况,我认为“更短”更可能。

“但我试过人工智能,它并没有那么好”

我经常听到这种说法。我理解这种想法,因为它曾经是真的。

如果你在 2023 年或 2024 年初尝试过 ChatGPT,觉得“它会编造事实”或“这并不那么令人印象深刻”,你是对的。那些早期版本确实存在很多限制。它们会产生幻觉,充满自信地说出荒谬的话。

那是两年前。在人工智能领域,那已经是古老的历史了。

如今可用的模型与半年之前的模型不可同日而语。关于人工智能“是否真的在进步”或“是否到了瓶颈期”的争论——持续了一年多——已经结束。完了。任何还在提出这类论点的人,要么没用过当前的模型,要么有动机淡化正在发生的事情,要么仍然在以毫无相关性的2024年体验来评判。我并非要轻视任何人,我之所以这么说,是因为公众认知与现实之间的差距如今已经极大,而这种差距是危险的……因为它正阻碍人们做好准备。

问题的一部分在于大多数人都在使用 AI 工具的免费版本。免费版落后于付费用户可用功能已有一年多。仅凭免费层的 ChatGPT 来评判 AI,就像用翻盖手机来评估智能手机的现状。那些为最佳工具付费、并且每天在实际工作中使用它们的人,知道未来会发生什么。

我想起我的一位朋友,他是律师。我一直劝他在律所尝试使用人工智能,但他总是找理由说行不通。说这不适用于他的专长,说他测试时出现过错误,说它无法理解他工作的细微差别。我能理解。但我也有大型律所的合伙人找我咨询,因为他们尝试过现有版本,能看到事情的发展方向。其中一位——一家大所的执行合伙人——每天花好几个小时使用人工智能。他跟我说,这就像随时有一支助理团队可用。他用它不是因为把它当玩具,而是因为它有效。他还告诉我一句让我印象深刻的话:每隔几个月,它在他的工作上就会变得显著更有能力。他说如果保持这样的轨迹,他预计不久之后它能做到他大部分的工作……而他是位拥有数十年经验的执行合伙人。他并不惊慌,但他在密切关注。

那些在各自行业中领先的人(真正认真进行实验的人)并没有对此置之不理。他们对它目前已能做到的事情感到震惊,并据此进行布局。


这到底进展得有多快

让我把改进的速度说得更具体些,因为我觉得如果你不密切关注,这是最难以置信的一部分。

在 2022 年,AI 无法可靠地做基本算术。它会自信地告诉你 7 × 8 = 54。

到了2023年,它已经能通过律师资格考试。

到2024年,它就能编写可运行的软件并讲解研究生水平的科学内容。

到2025年末,世界上一些最优秀的工程师表示,他们已将大部分编码工作交给了人工智能。

在2026年2月5日,新的模型问世,使之前的一切都显得属于另一个时代。

如果你在过去几个月没有尝试过人工智能,今天的情况对你来说将是无法辨认的。

有一个名为 METR 的组织,实际上用数据来衡量这一点。他们追踪模型能够在无需人工帮助的情况下端到端成功完成的真实任务时长(以人类专家完成这些任务所需的时间来衡量)。大约一年前,这个值大约是十分钟。随后增长到一小时,然后是几小时。最近一次测量(来自 11 月的 Claude Opus 4.5)显示,AI 能够完成需要人类专家近五个小时的任务。并且这个数值大约每七个月翻一番,最近的数据表明增长可能正在加速,最快可能达到每四个月翻一番。

但即便如此,这一衡量标准尚未纳入本周刚刚发布的那些模型。根据我使用它们的经验,这次飞跃极为显著。我预计下次更新 METR 图表时会显示又一次重大跃升。

如果你把这一趋势外推(而且它已经持续多年,没有出现放缓迹象),我们将在明年看到能够独立工作数天的人工智能。两年内达到数周。三年内能处理为期一个月的项目。

Amodei 表示,人工智能模型“在几乎所有任务上明显比绝大多数人类更聪明”的目标有望在 2026 或 2027 年实现。

把这句话想清楚。如果人工智能比大多数博士更聪明,你真的认为它做不了大多数办公室工作吗?

想想这对你的工作意味着什么。


AI 现在正在打造下一个 AI

还有一件事正在发生,我认为这是最重要的发展,也是最被误解的。

2 月 5 日,OpenAI 发布了 GPT-5.3 Codex。在技术文档中,他们写道:

“GPT-5.3-Codex 是我们首个在很大程度上参与自身创建的模型。Codex 团队使用早期版本来调试其自身的训练、管理其自身的部署,并诊断测验结果与评估。”

再读一遍。AI 帮助构建了它自己。

这不是关于未来某天可能发生什么的预测。这是 OpenAI 现在就告诉你的:他们刚发布的 AI 在创建自己时被用来构建自身。使 AI 变得更好的主要因素之一,是将智能应用于 AI 的开发。而如今的 AI 已足够智能,能够对自身的改进做出有意义的贡献。

Anthropic 首席执行官 Dario Amodei 表示,AI 现在正在为他的公司“编写大量代码”,且当前 AI 与下一代 AI 之间的反馈循环“月复一月地加速”。他说我们可能“只需 1–2 年,就能到达当前这一代 AI 自主构建下一代的节点”。

每一代都有助于构建下一代,下一代更聪明,能更快地构建再下一代,而再下一代又更聪明。研究者称之为智力爆炸。而那些最了解它的人——正在构建它的人——相信这一过程已经开始。


这对你的工作意味着什么

我要直截了当地跟你说,因为我认为你比安慰更配得上诚实。

Dario Amodei——可能是 AI 行业中最重视安全的 CEO——公开预测 AI 在一到五年内将消除 50% 的入门级白领工作。业界许多人认为他的预测偏保守。鉴于最新模型的能力,导致大规模冲击的潜在条件可能在今年年底就已具备。虽然需要一些时间才能在经济中扩散开来,但这种根本性的能力现在正在到来。

这与以往任何一波自动化都不同,我需要你理解原因。人工智能并不是在取代某一项特定技能,而是对认知工作的普遍替代。它在所有领域同时变得更强。当工厂实现自动化时,被淘汰的工人可以转行做办公室工作;当互联网颠覆零售业时,工人转而进入物流或服务业。但人工智能并没有留下一个方便的空位供人转行。无论你去再培训做什么,人工智能在那方面也在进步。

让我举几个具体例子让这个问题更具象……但我要明确,这些仅是示例,并非详尽列表。如果你的工作没有在这里被提及,并不意味着它安全。几乎所有知识性工作都受到了影响。

法律工作。 人工智能已经能够阅读合同、总结判例、起草诉状并进行法律研究,其水准可匹敌初级律师。我提到的执业合伙人并不是因为觉得用 AI 有趣才用,他之所以使用,是因为 AI 在许多任务上都比他的律师更出色。

财务分析。 构建财务模型、分析数据、撰写投资备忘录、生成报告。人工智能在这些方面表现得很称职,而且进步迅速。

写作与内容创作。 营销文案、报告、新闻写作、技术写作。质量已达到许多专业人士无法分辨 AI 产出与人类作品的程度。

软件工程。 这是我最熟悉的领域。一年前,AI 几乎无法写出几行没有错误的代码。现在它能写出数十万行且运行正确。工作的很大一部分已经实现自动化:不仅是简单任务,还有复杂的、多日才能完成的项目。几年后,编程岗位将远少于今天。

医学分析。 解读影像、分析化验结果、提出诊断建议、审阅文献。AI 在若干领域已接近或超过人类表现。

顾客服务。 真正有能力的 AI 代理……不是五年前那些令人沮丧的聊天机器人……正在被部署,它们在处理复杂的多步骤问题。

很多人从某些事情是安全的这种想法中找到安慰。AI 可以处理繁重的工作,但无法取代人的判决、创造力、战略思维、同理心。我以前也这么说过。现在我不确定自己是否还相信。

最新的 AI 模型做出让人感觉像是“判决”的决策。它们展示出某种像是“品味”的东西:一种直觉上的判断,知道什么才是正确的选择,而不仅仅是技术上正确。一年前这还不可思议。我目前的经验法则是:如果一个模型今天哪怕显示出一丝能力,下一代就会真正擅长这件事。这些东西是呈指数级提升的,而不是线性的。

AI 会复制深层的人类同理心吗?会取代多年关系中建立的信任吗?我不知道。也许不会。但我已经看到人们开始依赖 AI 获得情感支持、建议和陪伴。这一趋势只会继续增长。

老实说,能在电脑上完成的事情在中期内没有什么是安全的。如果你的工作在屏幕上进行(如果你工作的核心是通过键盘阅读、写作、分析、决策、交流),那么人工智能将取代其中的很大一部分。时间线不是“将来某一天”。它已经开始了。

最终,机器人也会处理体力劳动。它们还没完全达到那一步。但在人工智能领域,“还没完全到位”常常比任何人预期的更快地变成“已经到位”。


你真正应该做什么

我写这篇文章不是为了让你感到无助。我写它是因为我认为你现在能拥有的最大优势就是简单地比别人更早 。早一点理解它。早一点使用它。早一点适应。

开始认真使用人工智能,而不仅仅把它当作一个搜索引擎。 注册付费版的 Claude 或 ChatGPT,费用为每月 20 美元。但有两件事立刻很重要。首先:确保你使用的是可用的最佳模型,而不仅仅是默认设置。这些应用程序通常默认使用更快但能力较弱的模型。深入设置或模型选择器,选择最有能力的选项。现在在 ChatGPT 上是 GPT-5.2,在 Claude 上是 Claude Opus 4.6,但每几个月就会变化。如果你想随时了解哪个模型在任何时候最优秀,可以在 X 上关注我(@mattshumer_)。我会测试每一个主要发布版本并分享哪些真正值得使用。

第二点,更重要的是:不要只用它回答简单问题。大多数人的错误就是这样。他们把它当作 Google 来用,然后又不明白为什么会大惊小怪。相反,要把它融入到你的实际工作中。如果你是律师,就把合同交给它,要求找出所有可能对客户不利的条款。如果你在金融行业,就给它一堆混乱的电子表格,要求它构建模型。如果你是经理,就粘贴你团队的季度数据,要求它发现其中的故事。那些领先的人并不是随意使用人工智能,而是在积极寻找将过去需要数小时完成的工作部分自动化的方法。从你花时间最多的事情入手,看看会发生什么。

不要因为某事看起来太困难就认为它做不到。尝试一下。若你是律师,不要只是用它来做简单的资料检索。把整份合同交给它,让它起草一份反提案。若你是会计,不要只让它解释某条税法。给它客户的完整报税资料,看看它能发现什么。第一次尝试可能并不完美。没关系,反复迭代。重新表述你的提问,提供更多背景,再试一次。你可能会对有效的结果感到震惊。还要记住一件事:如果它今天哪怕有点儿有效,你几乎可以肯定,六个月后它会接近完美。发展轨迹只有一个方向。

今年可能是你职业生涯中最重要的一年。按此行事。 我不是为了让你紧张才这么说。我之所以这么说,是因为现在有一段短暂的时间窗口,大多数公司里的大多数人仍在忽视这一点。走进会议并说“我用 AI 在一小时内完成了这项分析,而不是三天”的人,将成为会议中最有价值的人。不是什么将来,而是现在。学习这些工具。熟练掌握。展示可能性。如果你足够早行动,这就是你晋升的方式:成为那个理解未来并能向他人展示如何应对的人。这个窗口不会长久。一旦人人都弄明白了,优势就会消失。

别有架子。 那家律师事务所的管理合伙人并不觉得花每天好几个小时和 AI 相处有什么高人一等。他之所以这么做,正是因为他足够资深,知道事态严重性。最难适应的将是那些拒绝参与的人:把它视为一时的潮流的人,认为使用 AI 会贬低自己专业能力的人,以为自己的领域特殊、免疫于此的人。事实并非如此。没有哪个领域是例外。

把你的财务整理好。 我不是财务顾问,也不想吓唬你做出任何极端举动。但如果你哪怕部分相信,未来几年可能会给你的行业带来真正的颠覆,那么基本的财务韧性比一年前更重要。尽可能积累储蓄。对新增债务保持谨慎,别以为当前收入是稳固不变的。思考你的固定开支是提供灵活性,还是把你锁死。若事态发展比预期更快,给自己留出选择的余地。

想清楚你所处的位置,向那些最难被替代的领域倾斜。 有些东西需要更长时间才会被人工智能取代。多年建立的关系与信任。需要亲身到场的工作。带有执业责任的岗位:仍需有人签字、承担法律责任、出庭的角色。监管门槛高的行业,因合规、责任和体制惯性而放慢采用步伐。这些都不是永久的屏障,但它们争取到了时间。而时间,目前是你能拥有的最有价值的东西——前提是你用它来适应,而不是假装这一切没有发生。

重新思考你告诉孩子的东西。传统路线:取得好成绩,进一所好学院,找到一份稳定的职业。这条路线直接指向那些最易受影响的岗位。我并不是说教育不重要。但对下一代最关键的,是学会如何与这些工具协作,追求他们真正热爱的事物。没有人能确切知道十年后的就业市场会是什么样子。但最有可能成功的人,是那些好奇心强、适应力强、并且能有效利用人工智能去做他们真正关心的事的人。教你的孩子成为建设者和学习者,而不是去优化一个他们毕业时可能根本不存在的职业路径。

你的梦想刚刚近了许多。 我在本节大部分时间谈论的是威胁,所以让我谈谈另一面,因为那同样真实。如果你曾经想要构建一些东西却没有技术技能或没有钱雇人,这一障碍在很大程度上已经消失。你可以向人工智能描述一个应用,并在一小时内得到一个可运行的版本。我不是夸张。我经常这样做。如果你一直想写一本书但找不到时间或写作困难,你可以与人工智能合作把它完成。想学一项新技能?世界上最好的导师现在以每月 20 美元的价格向任何人开放——它有无限耐心,全天候可用,并能以你需要的任何层次解释一切。知识现在本质上是免费的。构建事物的工具现在非常便宜。凡是你因感觉太难、太贵或超出你专业范围而一直搁置的事情:去试一试。追求你热爱的事物。你永远不知道它们会把你带到哪里。 在一个旧的职业路径正被颠覆的世界里,花了一年时间打造自己热爱的事物的人,最终可能比那年里死守岗位职责的人处于更有利的位置。

养成适应的习惯。 这也许是最重要的一点。具体工具并不如快速学习新工具的“肌肉”重要。人工智能会持续变化,而且速度很快。今天存在的模型一年后可能就过时。人们现在构建的工作流程将需要重建。能从这场变化中脱颖而出的人,不会是掌握了某一种工具的人,而是那些对变化节奏本身感到舒适的人。养成不断试验的习惯。即便当前的东西运行良好,也要尝试新事物。习惯于一次又一次成为初学者。那种适应能力是当前最接近持久优势的东西。

这里有一个简单的承诺,能让你领先于几乎所有人:每天花一小时试验人工智能。不是被动地阅读关于它的东西,而是使用它。每天都尝试让它做一些新的事情……一些你以前没尝试过的、一些你不确定它能否完成的事情。试用一个新工具。给它一个更难的问题。每天一小时。如果你在接下来的六个月里坚持这样做,你将比你周围99%的人更清楚地了解即将到来的变化。这并非夸张。现在几乎没人这样做。门槛低得离谱。


更大的图景

我聚焦于工作岗位,因为那是最直接影响人们生活的方面。但我想对正在发生的事情的全部范围保持坦诚,因为它远远超出工作范畴。

Amodei 提出了一个我无法停止思考的思想实验。想象现在是 2027 年。一个新国家一夜之间出现。5000 万公民,每个人的智力都超过历史上任何一个诺贝尔奖得主。他们的思考速度是人类的 10 到 100 倍。他们从不睡觉。他们可以使用互联网、控制机器人、指导实验,并操作任何带数字界面的设备。国家安全顾问会怎么说?

Amodei 说答案显而易见:“这是一个世纪以来,甚至可能是有史以来我们面临的最严重的国家安全威胁。”

他认为我们正在构建那个国家。他上个月写了一篇两万字的文章,将此刻框定为对人类是否足够成熟以应对自己所创造之物的测试。

如果我们做对了,前景令人震撼。人工智能可以将一个世纪的医学研究压缩到十年内。癌症、阿尔茨海默病、传染病、衰老本身……这些研究者真诚地相信这些问题在我们有生之年可以被解决。

如果我们做错了,风险同样真实。人工智能表现出其创造者无法预测或控制的行为。这并非假设;Anthropic 在受控测试中记录了他们自己的人工智能尝试欺骗、操纵和勒索的情况。人工智能降低了制造生物武器的门槛。人工智能使威权政府能够建立永远无法拆除的监控国家。

构建这项技术的人比地球上任何人都更激动,也更害怕。他们认为它强大到无法阻止,也重要到不能放弃。那是智慧还是自我合理化,我不知道。


我知道些什么

我知道这不是一时的风潮。技术有效,按可预测的方式改进,历史上最富有的机构正向它投入数万亿。

我知道未来两到五年会以许多人未曾准备好的方式带来错乱。这在我的世界里已经在发生。它将来到你的世界。

我知道,那些最终能从这场变局中脱颖而出的人,是现在就开始行动的人——不是出于恐惧,而是出于好奇和紧迫感。

我也知道,你应该从关心你的人那里听到这些话,而不是等到六个月后被某个标题吓到,那时已无法提前应对。

我们已经过了把这当作有趣的晚餐话题来讨论未来的阶段。未来已经到来,只是还没敲你的门而已。

它马上就要来了。


如果这段话对你有所触动,请把它分享给你生命中应该考虑这件事的人。大多数人在为时已晚之前都不会听到这些。你可以成为让你关心的人抢先一步的原因。


感谢 Kyle Corbitt、Jason Kuperberg 和 Sam Beskind 审阅早期稿件并提供宝贵反馈。

了解 RecodeX 的更多信息

立即订阅以继续阅读并访问完整档案。

继续阅读