从模型到系统:定义这一转变的基础构件与对齐策略
本文信息来源:anneliesgamble
我们已经进入了 AI 的系统阶段。在这一阶段,结果的驱动因素不再主要是模型规模,而更多取决于模型如何高效地融入上下文、工具和反馈回路。
一小组基础原语正在定义这场向系统化转变。这些原语是决定 AI 系统在生产环境中如何运行、学习并创造价值的基础构建块:
- 工具使用将模型从对话者转变为实际操作者。系统如今可以将计算器、数据库、ERP、承保引擎以及代码执行作为一等动作来调用。其结果是更高的精确性与可问责性:模型不再只是建议下一步,而是直接调取记录、更新理赔、起草订单,并记录发生的过程。对于购买方而言,这推动 AI 从“辅助式”迈向“闭环”,在这一模式下,价值的最小单位是一条已完成的工作流。
- 动态上下文正在成为新的数据层。诸如 Model Context Protocols(MCP)这样的协议,使 AI 系统能够在运行时动态访问合适的上下文(例如文档、API、工具或用户状态)。这使系统从静态、预加载的信息,转向具备更深度个性化和情境感知能力的上下文。因此,上下文在不同模型和工具之间变得更加可移植、可组合,而战略护城河也从“拥有数据集”转向“掌握数据、政策与决策之间的映射关系”。
- 智能路由器会根据复杂度、延迟或成本,决定由哪个模型(或一系列模型)来处理每个任务。系统会动态地将计算资源分配给当下最合适的方案。随着时间推移,这些路由器会学习模式:何时调用推理模型,何时捷径式地使用更小的模型,何时串联专门化工具。最终,在真实世界约束下,实现更高的效率和一致的质量。
- 遥测捕获系统在生产环境中的行为:选择了哪些路由、耗时多久、产生了什么结果,以及用户如何响应。正是这一可观测性层,将黑盒推理转变为数据驱动的优化闭环。借助合适的指标,系统可以自动调优路由、微调和工具使用,从而在学习中不断改进。
某些对齐策略正构建在这些原语之上。合成数据、可验证奖励以及多轮目标正在重塑系统如何从自身输出中学习。模型不再依赖静态的人类标注,而是通过 AI 裁判、验证器和模拟器生成训练信号。这降低了个性化的成本,并使系统能够直接与现实世界的性能指标对齐。在机器人、化学和制造等物理领域,同样的原则延伸到现实世界的落地,其中反馈来自传感器和现场数据。
综合来看,这些原语和对齐策略正在将前沿推向这样一种系统形态:由更小、更便宜、更加专用的模型组成,并通过编排层实现协调。
这种转变同时改变了 AI 应用的价值主张和成本结构。对于那些抵消或替代人工成本的应用,我们已经看到有人尝试采用与人工薪资类似的按小时或按月收费模式。这种方式在竞争较低的市场中可能奏效,但随着能力不断商品化、越来越多的系统进入同一工作流,其可持续性很可能难以维系。
从更长远来看,差异化将转向与价值对齐的定价方式,应用于 AI 深度嵌入、强领域特定性并具备运营责任的工作流。在这些场景下,买方将为可衡量的结果付费,例如一次已解决的支持工单、一笔已结案的理赔,或一份已完成的法律文书。在高波动性或具有重大财务影响的领域,系统甚至可能直接承担风险,通过对实现的节省成本或收入收取一定比例的费用。
随着这些系统日益成熟,差异化将上移到技术栈更高层的要素上,例如上下文如何被组合、决策如何被路由,以及失败如何被检测。要构建具有防御性的护城河,需要将领域工作流、激励机制和可衡量的结果紧密耦合。这也是我认为垂直化很重要的原因之一:系统越接近某一领域的真实基础,就越容易使其行为与价值保持一致。
对于构建者而言,这意味着需要更多地思考用于治理路由、上下文和责任归属的控制平面。对于购买方而言,这意味着将 AI 视为一个运营者——一个可以被审计、持续改进,并最终被信任承担责任的角色。而对于整个市场来说,这意味着对 ROI 的重新定义。