如果苹果的 Siri AI 真如 WWDC 演示中那样出色，苹果有望在消费级 AI 领域占据领先地位，iPhone 也将成为首款真正意义上的 AI 设备

如果单从 AI 的角度来看，Apple 昨天在 WWDC 主题演讲中展示的内容，并没有什么特别具有突破性的地方。事实上，其中很多功能在其他 AI 工具和服务中早已出现——有些甚至早在数年前就已具备。那又怎样？这并不重要。根据我们昨天所看到的一切，Apple 已注定将在 AI 领域胜出——至少从消费者的角度来看是如此。

我知道这听起来有多疯狂。问题不仅在于，过去几年里 Apple 一直被视为在 AI 领域落后，更在于，鉴于他们两年前试图推出“Apple Intelligence” 时的表现，以及最终因虚假宣传相关问题达成诉讼和解，他们几乎已成了笑柄。但如果 Apple 真的能够推出他们昨天展示的那些内容——下文我会谈到其中的附带条件——而且这一次也确有理由相信他们能做到，那么他们将会激怒横跨众多行业的大量个人和公司。原因在于，Apple 似乎又站在了重施故技的边缘：先观察新的产品和服务出现，随后再晚一步入场，凭借更好的用户体验赢得最终胜利。

这之所以让人恼火，是因为……他们怎么能总这样！谁谁谁很早以前就在做这个了！首创！这都是老东西了！无聊！差劲。他们不能总这么逍遥下去！昨天主题演讲结束后的各种反应，把这一切展现得淋漓尽致。而华尔街似乎也站在了这些愤怒人群一边，推动该股在盘后交易中下跌。

我要告诉你的是，这些都不重要。对于那些站在 AI 最前沿的人来说，Apple Intelligence 和全新的“Siri AI”或许显得不过如此。但 99% 的人并不生活在那里。更有甚者，实际上有更多人并不想要生活在那里，只是在某种程度上觉得自己必须跟上，否则就会觉得自己在这个 AI 时代被甩在了后面。如果说 ChatGPT 是把 AI 带给了大众，那么 Apple 即将把 AI 的使用推向主流。

当我看到 Apple Siri 工程副总裁 Mike Rockwell—— 那个肩负修复 Siri 重任的人 ——在主题演讲中进行演示时，我立刻就明白了这一点。整个过程简单、自然，而这正是关键所在。他所做的，不过是按住侧边按钮（或许他们该把它改名叫 Siri 按钮？），然后对着 Siri AI 说话。他不需要打开终端，也不需要下载什么编程应用。他根本不需要下载任何应用。从 iPhone 开箱那一刻起，Siri AI 就能直接运行。

当然，前提是 Siri 真的好用。

这就是为什么这段演示至关重要。虽然它不是现场演示——而且如果它真的是在台上实时进行 ，效果显然会更好——但它显然是实时拍摄的。过程中这里那里都有些轻微延迟，而且并未被剪掉。这显然是 Apple 有意为之，目的是让你看到，与比如两年前不同，这不是纸上谈兵。这是 Siri 真的在做事。做那些她此前还做不到的事。

再说一次，若单从纯 AI 角度来看，其中很多内容并不算特别惊艳。但语境很重要——而且在这里几乎就是字面意义上的重要。这一直都是 Apple Intelligence 的承诺：Apple 能够调动 iPhone 所了解的关于你的一切来处理任何查询，并在此基础上用“世界知识”加以增强。两年前 Apple 还做不到这一点，但现在 Google 来救场了。他们此次甚至获得了公开点名，这足以说明 Google 对这项努力有多么关键。没错，Apple 将 Gemini“蒸馏”后打造出他们自己的全新“Apple Foundation Models”，但真正让这一切这次能为 Apple 奏效的，是 Google 在训练这些模型时完成的重活。

那么，为什么不直接用 Gemini 呢？毕竟，已经有相应的应用了。没错，你可以这么做，而且很多人也会这样做。但会有更多人不会，仅仅是因为 Siri 是系统级内建的。这让它拥有其他任何 AI 服务都无法比拟的能力——至少在监管机构试图迫使 Apple 向其他服务开放这类权限之前是如此。但即便那真的在多年后发生，真正的力量依然掌握在“默认选项”手中。用户无需下载并打开一个应用，只要按住一个按钮，或者说一声“Siri”，一切就都能运转起来。

回到 Rockwell 的演示，在我看来，关键之处在于，整个过程都是通过语音完成的。当然，其中一部分原因是，相比打字，这样的演示效果更好；但这也很可能会成为很多人开始使用 Siri AI 的方式。我之所以这么说，是因为这已经是我在很多时候与 AI 互动的方式。也许我有些主观，但我也看到，我的孩子们多年来一直在使用 Alexa 之类的产品。他们正在以更“自然”的方式学习使用电脑——不是通过鼠标和键盘，而是通过触控和语音。

显然，有些时候你不想用语音，或者没法用语音，但我非常怀疑，在许多使用场景中，它会成为与 AI 交互的首选方式。这也正是为何我们即将看到一波围绕这种交互模式打造的新设备涌入市场。但正如近 20 年前 iPhone 问世时我们对摄像头所认识到的那样，最好的 AI 设备，将是你随身携带的那一台。而至少在可预见的未来，那就是 iPhone。

这正是昨天这些演示所传达的核心。iPhone 如今已是一台 AI 设备。iPad 也是。Mac 也是。Apple Watch 也是。甚至 Vision Pro 也是。

很快，AirPods 也会是。还有 Apple 显然正在酝酿的其他一些设备。没错，Meta 和其他公司已经推出了这类设备，但他们没有 iPhone。可他们仍然需要 iPhone。而这就是问题所在。一旦 Apple 推出 Siri AI，这个问题只会变得更大。

只有 Google，或许再加上 Samsung，凭借自家的智能手机，才能在这片战场上与 Apple 正面交锋。但尽管 Google 自行掌控 Gemini，他们也很难在自家 Pixel 手机之外的每一台设备上匹敌 Apple 的产品体验。而 Pixel 在市场中只占据极小的一部分份额。Google 或许应该设法把 Pixel 设备做大，以在这方面追赶 Apple——也许双方的合作将像 iPhone 早期那样，让这一机会更加清晰。但这将涉及与更广泛 Android 生态之间复杂的权衡，没错，其中也包括 Samsung。

这再次体现了 Apple 对其全栈整合模式的运用。令人意外的是，他们似乎无需从零开始打造自家的前沿模型，也能做到这一点。但他们或许正好赶上了一个竞争者林立的市场，因此 Google、OpenAI 和 Anthropic 都想争取与 Apple 的合作。他们现在可能会说，既然 Google 已经拿下了这笔业务，自己其实并不想要，但显然并非如此。谁会拒绝接触数十亿高度活跃、参与度极高且极具商业价值的用户呢？

从长远来看，Apple 不可避免地必须更多依靠自身。再说，Google 一旦像他们一贯那样转移重心，也可能会迫使这一问题浮出水面。而到那时，我们或许已经来到这样一个节点：相比 “世界模型”，LLMs 的重要性已不再那么高。但就眼下而言，Apple 恰恰做了他们为了“追赶上来”所需要做的事。

再说一遍，这并不意味着他们目前能在所有方面都与 Anthropic、OpenAI，甚至 Google 的人工智能能力完全持平。但对大众而言，就 Apple 的目的来说，其中大部分都无关紧要。只有当这些参与者中的某一家真正实现了产品和/或面向消费者的应用场景突破时，这一点才会变得重要。而在这些参与者中，OpenAI 最擅长打造这类突破。但如今，他们正将业务重心转向编程和企业应用场景。因为正如 Anthropic 很快向所有人展示的那样，钱就在那个领域。

但对 Apple 来说，钱并不在这里。他们的收入来自销售设备，而这又会进一步带动服务销售。这里可能会通过 iCloud+ 进行某种程度的 AI 增值销售，但规模不会像其他 AI 玩家那样大。至于广告，虽然也不能把话说死与广告相关，但对 Apple 而言，你大概至少在短期内可以忘了这件事。这部分原因在于，Apple 此番宣传的核心卖点之一就是隐私。Apple 甚至在主题演讲中毫不避讳地向合作伙伴开火，比如指出，其他带有 AI 的网络浏览器“会追踪你的一举一动”——真让人好奇，如今全球最受欢迎、现已内置 AI 的网络浏览器究竟是谁做的……——而 Apple 不会这么做。

不过，最直接的一记抨击在一开始就来自 Craig Federighi：“不过，有些人似乎正在一味向前冲，仿佛是为了 AI 而追逐 AI，而不顾它最终本应服务的人——也就是我们所有人。” 啧，这说的是谁，真让人好奇……也许是 Apple 两年前那家重要的 AI 合作伙伴？值得一提的是，对方目前正考虑对 Apple 采取法律行动，原因正是这段合作中的失败与不足……

AI 的认知问题也将是 Apple 会重点强调的一个切入点，因为 Apple 拥有一种几乎没有其他科技公司享有的消费者信任度。而在一个全球——尤其是美国——都担忧 AI 将把我们带向何方、甚至可能取代我们的时代，Apple 能够提出一个更可信的叙事：只是将这项技术作为一种供人类使用的工具加以利用。

为此，当所有人都在忙着追逐智能体的前景，把自己的产品扩展成 “超级应用”、以便通过电脑端来承载这类工作时，Apple 刚刚展示了一个可在手机上完整运行的智能体。也可以在 iPad 上。或者 Mac 上。所有这些都通过他们自家的全新应用整合在一起，名字叫，等着瞧吧：Siri。事实上，它不是什么超级应用，而是一个超级简单的应用。¹ 这是一种在不同设备间汇集并延续你的 AI 工作流的方式。但它其实也并非必需，因为 Siri 就在那里，在你的灵动岛里（或者 Mac 上的 Spotlight 中），随时待命。

它能够以一种如果使用 Claude 则大约需要 15 个不同层级权限才能实现的方式查看你的屏幕。当然，为了防止用户“坑自己”，这是件好事 ——这无疑也将成为 OpenClaw 运动的关键教训之一。但话说回来，Apple 拥有其他公司无法比拟的信任度，以及他人难以企及的设备基础。

这将使“视觉智能”成为其中或许最深刻的一次转变。坦率地说，本来早就该如此，但 Apple 此前把它埋没了。如今，它将被放到许多人使用频率最高的应用—— 相机 ——最核心的位置。这指向了一个未来：可穿戴设备不再只是从视觉上增强我们的现实，而是能够直接叠加信息，无需你掏出手机。没错，Meta 已经朝这个方向前进，其他公司，包括 Apple，也将很快加入，但看起来我们距离真正实现这一点还差一步。至少目前，它是 iPhone 相机的一个绝佳用例，也是 Vision Pro 上一项有趣的演示。

这一切叠加起来，意味着 Apple 将掌控消费级 AI 世界。当然，除非你身处欧盟——那就尽情享受法规吧！或者你在中国——那就尽情面对监管吧！不过，最终这些地方大概也不会例外。

如果它真能奏效……

话虽如此，现在该谈但书了。在我昨天的前瞻文章中，我提到了 Steve Jobs 那句著名的“it just works”，而在观看这场主题演讲时，我也很快给自己的多条实时推文补上了一个新版本 “if it works”。这很有趣，但也很有必要！

基本上，两年前 Apple Intelligence 首次亮相时，上述判断也同样成立。但最终，当然也只是纸面上成立而已。这一次也有可能重演同样的情况，但你不得不相信，如果 Apple 这次没有十足把握，他们绝不可能在这场 1 小时 15 分钟的主题演讲中， 拿出 45 分钟的时间 来讲 AI。

更大的问题或许不在于 Siri AI 无法推出，而在于它推出时可能并不好用。在这里，我们可以回顾 Siri 过去 15 年的发展。每一年我们都被承诺 Siri 正变得更好。尽管这在一些细微之处或许确实如此，但相较于业界最先进水平——先是 Alexa，如今当然是 LLMs——Siri 每一年都显得更逊色。

再次强调，我认为正是 Google 的参与打破了这一循环。但这里仍然存在许多疑问。如果/当 Gemini 持续更新时，会发生什么？Apple 是否每次都需要重新蒸馏？除了 Google 之外，他们会自行更新模型吗？考虑到显然将有相当多的功能在本地运行，我们是否需要一次完整的软件更新才能更新这些模型？！所有这些都表明，这家公司或许仍未完全准备好在 AI 时代开展运营，而在这个时代，最先进的技术始终在不断变化。

好消息是，日常使用中的大多数场景将越来越不需要最先进的技术。事实上，对于大多数任务而言，使用最先进的技术的成本可能也会越来越高昂。再次强调，Apple 在这方面的时机或许把握得不错。但在 Siri AI 真正面向市场，并与比如 Mythos 这样的产品展开竞争之前，我们还无法确定这一点。

不过话说回来，我也不确定它们实际会有多大竞争。AI 重度用户始终会存在——我当然会是其中之一——但大多数用户并不会是 AI 重度用户。只要默认选项足够好，他们就会满足于使用默认选项。不过，这样说其实低估了 Apple，因为关键在于为诸如世界知识这类能力提供一个“足够好”的基础层，并将其与围绕个人数据的上下文信息相结合，而这恰恰是只有 Apple 能做到的。听起来简单，但这种复杂性并不容易实现。完全有可能出现这样一种局面：大多数 iPhone 用户会使用 Siri AI 来满足比如 80% 的 AI 需求，然后再选择另一种模型/服务来满足其余 20%。又或者情况会更加细分，由另外两种或更多 AI 服务来填补特定的细分场景。还是那句话，拭目以待。

但根据我昨天所看到的一切，我看到的是这样一个世界：Apple 将在相对较短的时间内拿下消费级 AI 的领先地位。明年，将有数以百万计的人一边走路一边与 Siri AI 对话，向她提出各种各样的问题，并把各种各样的任务交给她去处理。这是“默认选项”力量、Apple 自身更胜一筹的产品直觉、OpenAI 让出消费端高地、Google 在消费业务之外被无数不同方向牵扯精力（当然，它也在这里帮了 Apple 一把）、Microsoft 从来不擅长消费者业务、Anthropic 并不在乎消费者市场、Amazon 还没有智能手机（至少目前还没有？），以及 Meta 没有 iPhone 等多种因素共同作用的结果。

在 AI 领域一度被认为已经出局之后，如今一切又再次向着 Apple 倾斜。对某些人来说，这实在令人恼火——他们怎么就总能做到这一点。AI 成了购买 iPhone 的新理由。忘掉 AI PC 吧，这才是第一款真正的 AI 设备。 前提是它真的好用。

¹ 而且需要一个更好的图标 …… ↩