AI可以思考，但软件仍然必须负责

作者：Dhruv Sane

原文链接：https://dhruvsane.substack.com/p/ai-can-think-software-still-has-to

免责声明：本翻译文章仅限个人阅读，不用于任何形式的转载和发布。

亲爱的读者，合十礼：

我今年接触过的大多数软件创始人都正在提出/被问到一个错误的问题：“AI会抢走他们的饭碗吗？”

这是一种合理的恐惧。OpenAI不再仅仅是一个API提供商。Anthropic不再满足于停留在模型层。平台公司正在向上游移动，更接近客户，更接近工作流，更接近价值池。

但“AI会吃掉我们吗？”仍然是一个错误的问题，因为它是被动的。它会导致焦虑，而不是战略。

更好的问题是：软件能做什么基础模型从根本上做不到的事情？

我的答案很简单：AI可以思考，但软件仍然必须负责。

这种区别比大多数创始人意识到的还要重要。而今天在印度构建的大多数软件都站错了队。

曾几何时，默认的初创公司剧本看起来很明显：拿一个基础模型，在它周围包裹一个工作流，然后销售垂直产品。法律AI。人力资源AI。合规AI。销售AI。

模型进行推理。初创公司拥有界面。每个人都能赚钱。当模型层表现得像基础设施时，这种逻辑是行得通的。

现在它行不通了。

大型模型公司正越来越多地发布产品功能、连接器、操作和工作流原语，使它们更接近用户。因此，如果你整个公司都建立在模型将停留在你下方的前提之上，你就不是真正拥有你的产品。你是在租用它。

这就是为什么今天这么多AI软件公司感觉脆弱的原因。他们的差异化并没有错。只是太浅了。如果你的产品主要是一个更好的提示、一个更漂亮的UI，或者是模型输出周围的一个薄薄的包装，那么平台向你移动的速度可以比你远离它的速度更快。

这就是为什么我认为关键的创始人问题不再是，我如何将AI添加到我的软件中？

而是：在工作流的哪个环节我变得难以被移除，即使模型不断变得更好？

让我直接陈述核心论点。大多数关于这个话题的文章都会得出“AI威胁软件”的结论。那是事实，但没用。更精确的版本是：AI非常明确地威胁着软件公司的一个方面：认知。

认知 vs 后果：AI vs 软件

基础模型可以审查合同、分析账本、起草电子邮件或推荐下一步行动。

它通常能做得很好。

随着时间的推移，它几乎肯定会做得更便宜。

此外，这些模型正在启动它们自己的智能体，以捕获甚至连软件今天都珍视的执行层——智能体可以比人类更快地归档、结算、更新、协调、验证或提交信息，软件公司不能再仅仅扮演邮递员的角色了。

然而，LLM（大型语言模型）做不到的，至少它自己做不到的，是为结果承担责任。

那才是真正的分界线。

很多创始人仍然认为AI中的防御性将来自更好的推理、工作流的深度、更好的提示，或控制执行层。我不认为护城河会建立在那里。护城河建立在失败有成本的地方。

如果你的软件被用于失败是昂贵的、可见的、受监管的或在操作上令人痛苦的工作流中，那么客户购买的不仅仅是智能。他们购买的是问责制。

这就是为什么我不断回到同一句话：AI可以思考，但软件仍然必须负责。

以支付为例。模型可以标记欺诈模式、优化结账文案或帮助评估风险。但它不能成为结算资金、处理撤销、管理纠纷以及位于受监管支付流程内部的对手方。

以税务和合规为例。模型可以对发票进行分类、提出商品和服务税（GST）处理建议，或总结法律条款。但它不能成为公司通过其自信地实际提交、签署并完成闭环的受信任系统。

这是许多创始人正在错过的区别。如果你的产品主要帮助用户更好地思考，你就在与模型层和所有在其上构建的人竞争。如果你的产品为思考后发生的事情承担责任，你就在构建更难被取代的东西。

这就是区别：认知与后果。如果你的产品帮助用户更好地思考，你就在与OpenAI和地球上每个资金充足的AI团队竞争。如果你的产品对结果承担责任，如果失败的成本由你的公司吸收，你就在构建具有真正护城河的东西。

这也是为什么我认为印度创始人拥有比他们有时意识到的更好的机会。

印度最好的软件机会通常不是干净、抽象、纯软件的市场。它们是混乱的、例外情况繁多的、受监管限制的工作流，在这些工作流中，工作并不会在洞察处结束。

AI可以审查合同。它不能向公司注册处提交。
AI可以建议GST立场。有执照的专业人士或实体仍然必须支持它。
AI可以起草合规报告。它不能成为提交它、拥有审计跟踪并承担错误后果的受监管机构。

这种混乱不是印度市场的漏洞。它是防御性的源泉。

全球模型平台将追求具有巨大上升空间的大型水平类别。它们不会深入到每个印度特定的工作流、每个边缘情况繁多的监管流程，或者每个信任、本地背景和执行力比原始智能更重要的利基运营问题。

这创造了一个机会。

事实上，对于印度创始人来说，更有用的问题之一不仅仅是，市场有多大？

它也是，这个类别是否足够小、足够混乱、足够本地化，以至于全球平台懒得深入，但又足够痛苦，以至于客户仍然愿意为真正的解决方案支付高价？

这通常比每个人都涌入的明显类别是更好的切入点。

印度的制造工作流就是一个很好的例子。一家位于车间系统、ERP数据、质量检查、合规要求和客户报告之间的公司不仅在构建软件。它还在一个支离破碎的环境中构建运营信任。那不是基础模型公司可能通过插件赢得的市场。

我今天最信任的创始人不是那些拥有最令人印象深刻的演示的人。而是那些选择了一个早期就需要信任的工作流，并且有一条可信的路径，随着时间的推移变得越来越难被移除的人。

在实践中，这通常始于一个看起来不如纯软件投资者所希望的那么光鲜的楔子。

有时是产品加服务。有时是人在环路（human-in-the-loop）工作流。有时是客户首先购买可靠性而非自动化的狭窄用例。

这没关系。

事实上，在许多印度类别中，这是正确的开始方式。

法律工作流就是一个很好的例子。客户不仅想要更快的起草。他们想要更少的错误、更快的周转、更好的一致性以及更少的运营摩擦。与纯工具相比，产品加服务的楔子可以更快地赢得信任，因为买家不仅在评估软件质量。他们还在评估你是否能真正与他们分担部分重担。

但创始人应该诚实地面对他们所处的位置。

作为一家技术支持的运营企业与成为一家系统性嵌入的软件公司之间存在很大差异。

前者可以是有用的。后者可以是具有防御性的。两者之间的桥梁是工作是否产生复合效应。

在这样的环境下，当我审视一家软件公司时，我最关心以下这些问题：

你实际上正在吸收什么重担？

如果出了问题，什么痛苦由你承担而不是客户？

什么随着使用量的增加而复合？

你是否在构建通用模型看不到的专有工作流数据、异常处理、审批或结果历史记录？

你离执行有多近？

你仅仅是提供建议，还是越来越成为完成工作的系统？

人在环路是一个功能还是一个拐杖？

在许多印度工作流中，持牌人类判断具有法律或运营地位。这可以成为护城河的一部分。但前提是它有助于产品走向信任和问责制，而不是如果它永远掩盖了一个薄弱的产品。

你在关键的地方是模型不可知的吗？

如果你的公司完全被单一模型提供商劫持，你的产品风险比你想象的要高。

这些问题对我来说比演示看起来是否神奇更重要。

我确实认为公开市场已经在告诉我们一些有用的东西，尽管不是以人们通常构建的简单方式。

这不是一个“软件已死”的故事。

这是一个分化的故事。

仍然保持价值的软件类别是那些具有更深层嵌入、更强留存、更具结果性工作流、更好数据循环或真正的记录系统特征的类别。

受到压力的是那些主要位于读取路径上、添加浅层智能、并且随着模型改进可以被替代的软件。

后果飞轮：软件创始人构建的向量

因此，当创始人问软件是否仍然有吸引力时，我的回答是肯定的，但前提是你站在了界线的正确一边。

并非所有软件都会被同等地商品化。

但现在的举证责任要高得多。

如果这篇文章增加了价值，请考虑与您的网络分享。

在过去的一年里，我对无差异化的软件变得更加谨慎。

不是因为软件不重要。恰恰相反。

这是因为我认为很多过去看起来像软件价值的东西实际上只是被包装的认知。而打包认知的成本正在迅速下降。

我最感兴趣的公司是那些在狭窄的、混乱的、高上下文的工作流中构建的，在那里客户仍然为信任、执行和后果买单。

我喜欢那些明白目标不仅仅是在现有流程上叠加AI的创始人。目标是成为客户无法承受被剥离的流程的一部分。

这通常意味着工作流所有权。它通常意味着本地上下文。在早期，它有时意味着产品加服务。而且它几乎总是意味着赢得随着时间的推移向写入路径移动的权利。

我现在问每位软件创始人的问题很简单：

如果你的产品明天消失了，你的客户的工作流是会真正崩溃，还是他们只会用另一个看起来大体相似的工具替换你？

那就是考验。

今天正在构建的大多数软件都未能通过。

我想花时间交流的创始人是那些致力于构建后果而不是认知、构建问责制而不是便利、以及构建工作流所有权而不是界面修饰的人。

我认为那就是下一个真正软件价值将被创造的地方。

如果你正在那里构建，我希望能收到你的来信。

Dhruv

AI可以思考，但软件仍然必须负责

认知 vs 后果：AI vs 软件

后果飞轮：软件创始人构建的向量

推荐阅读

网络对智能体来说太人类化了

AI 问题矩阵 (The AI Problem Matrix)

AI 采用率的数据分析

AI到底能做多大？让我们算算账

AI可以思考，但软件仍然必须负责

认知 vs 后果：AI vs 软件

后果飞轮：软件创始人构建的向量

推荐阅读

网络对智能体来说太人类化了

AI 问题矩阵 (The AI Problem Matrix)

AI 采用率的数据分析

AI到底能做多大？让我们算算账

了解 RecodeX 的更多信息