智能体视角#3:灯光、镜头...智能体?
AI 智能体可根据指令进行导演与动画制作。Morphic 实现角色一致性突破,HeyGen、Chai-2、String 等新品亮相

#1: String——拖放操作已死,提示工程长存

作为一个非技术人员,当我第一次尝试使用 n8n 构建工作流时,那种挫败感几乎让我哭出来。连接器、节点、逻辑门——这实在算不上最直观的操作平台。那种感觉就像蒙着眼睛设置 Zapier 流程一样。
n8n 仍是低代码自动化领域的默认首选,但其设计已略显疲态。这种源自早期低代码时代的拖放式界面,很可能在未来几年内使其痛失榜首地位。
这正是 String.com 大显身手之处。依托 Pipedream 技术支持的 String 彻底革新了用户体验模型:你不再需要构建工作流,而是直接描述需求。这个自然语言智能体构建器能将你的指令转化为自动化代理程序。
想要一个能分析销售通话记录并自动生成摘要发布到 Slack 的助手?只需开口说明。需要将博客文章改写成 LinkedIn 文案?直接提出要求。String 会解析请求、规划执行方案、在沙盒环境中测试,若遇到障碍(测试阶段难免出现),还会尝试自动修复。
我们亲测效果:耗费 5 分钟时间和 100 万 token 后,成功创建了一个能分类收件箱邮件并起草回复的智能代理。界面简洁明了,整个操作流程比传统工具便捷何止千万倍。

它并不完美。目前的 token 上限是 400 万(对复杂智能体来说太低),成功率仍徘徊在 50%-75%之间。但即便是 alpha 版本,其流畅度也远超我们测试过的同类产品。
从提示到工作流是用户体验的下一个自然演进方向。就像编程从打字转向提示输入那样,自动化也正朝着相同方向发展。 语言已成为交互界面,而 String 这类工具正在证明这正是智能体应该存在的地方。
#2: 角色漂移正在扼杀生成式 AI 视频 变形技术或成解药

生成式 AI 工具有一个始终搞不定的问题?角色一致性。让大多数模型保持同一个人物在不同场景中看起来像他们自己 ,整个幻象就会崩塌。面容改变、服装扭曲、身份漂移。突然间,你严肃的营销资产就变成了玩具般的儿戏。
但营销人员?他们非常重视一致性。
88%的人已经在日常工作中使用生成式 AI。92%的企业计划在未来三年加大投入 。然而角色漂移仍是主要障碍,尤其对需要大规模打造精品营销活动的企业团队而言。
这就引出了本周的潜力黑马:Morphic。

Morphic 提供完整的图像转视频流程,通过 AI 工具实现皮克斯级别的创作野心。包含逐帧生成、动画制作、转场效果,当然还有角色一致性保障。
他们最新的杀手锏是?
单图角色建模。 上传单张图片(或仅输入文字描述),Morphic 就能训练出跨角度、跨场景、跨风格的角色一致性模型。训练耗时约 15 分钟,之后你就能无惧角色失真地构建完整故事线。
但真正的 MVP 是 Morphic Copilot,这个创意助手能协助构思场景、调整氛围并优化视觉效果。它虽非导演,却是个超棒的实习生——安静、高效,出人意料地实用。
我们给出了这个简单的提示作为测试:“ 故事讲述的是汤姆,一位人工智能研究员,他喜欢在静谧的夜晚于工作室里边学习边听音乐。我们想要营造一种平和、放松的氛围。”
它在几秒钟内就返回了一个完整的故事大纲(《汤姆的午夜研究》),生成了三张图片,并将其中一张制作成了动画视频。
如果你想看看其他人构建了什么, 这里有个社区亮点集锦 。
核心价值:Morphic 标志着向真正 AI 驱动的媒体制作迈进一步。想象系列化内容、品牌故事和动态营销活动都将成为可能。
#3: HeyGen 立志成为视频创作的全能操作系统

短视频席卷了互联网。这并不令人意外。90% 的人每天都会观看 ,留存率甚至能达到 50%。我们集体的注意力持续时间如今正式短于金鱼 (8.25 秒 vs 9 秒)。
问题在于?制作优质内容依然令人头疼。它耗时、昂贵,通常还受限于编辑、代理商或自由职业者。即便 AI 工具层出不穷,个人创作者和小团队仍处于劣势。
这时 HeyGen 登场了。
你可能已经在领英和初创公司演示视频中见过那些对口型的虚拟形象。它们已成为无需真人出镜的"说话头"讲解视频标配。
现在他们的目标要大得多。
HeyGen 刚刚宣布即将推出视频智能体 ,并称之为"全球首个创意操作系统"。这个说法相当大胆,但演示效果确实令人信服。
只需输入提示词、PDF 或原始素材,HeyGen 的视频智能体就能自动处理:
-
解析你的输入内容以寻找故事线
-
撰写剧本
-
使用 Avatar 4 选取或生成视觉素材
-
调整时间轴、动作和字幕
-
几分钟内即可生成可直接发布的视频
它实现了全栈式视频制作,无需时间轴、拖拽操作或数小时剪辑。只需输入→输出。
过去需要一周制作的 30 秒广告?现在只需五分钟,还能顺便喝杯咖啡。这才是我们期待已久的生成式 AI 工具。短视频就是金矿,创作者们只是需要更好的工具。
随着视频制作流程简化为一条指令,敢闯敢拼的创作者终于有机会挑战行业巨头。预算不再是决胜关键, 执行力才是。
附:想试试吗? 这里是等候名单 。
#4:Chai-2 从老鼠实验迈向模型构建。

我们常说:科学是人工智能最有可能真正推动人类进步的地方。本周,我们清晰地瞥见了那个未来。
抗体发现向来进展缓慢、成本高昂且效率极低。传统方法如动物免疫或合成库筛选简直如同苦役,需要处理数百万样本、耗费数月实验室工作,命中率勉强达到 0.1%,就像用茶匙挖金矿般艰难。
Chai Discovery(没错,就是 OpenAI 投资的那家)刚刚发布了 Chai-2——一个能从零设计新型抗体的人工智能代理。你只需输入目标表位,它就能快速生成潜在抗体。
在对 52 个既往无药可用的靶点进行的盲测中,Chai-2 为每个靶点生成的抗体设计不超过 20 种。其中半数抗原首次尝试便获得成功结合体。在某些测试中,命中率突破 20%,较传统方法实现百倍提升 。
少一些"折磨小白鼠",多一些"喂养模型"。
你仍然需要一个实验室、一套验证流程和一些动手的湿实验工作。但 Chai-2 感觉像是专为智能体设计的生物技术原型。未来的重点可能不是建造更大的实验室,而在于规模化更好的创意,并设计更聪明的智能体来执行它们。
#5: 特鲁利——我们配得上诚实吗?
还记得 Cluely 吗?那个由 21 岁哥伦比亚大学辍学生创立的初创公司,承诺让你"永远不用再思考"?其实时 AI 代理能帮你在任何场合作弊:面试、会议、考试、生活。
现在来看看反驳的声音。
一些哥伦比亚大学的学生(没错,这些还在校就读的)最近开发了 Truely,这是一个反 Cluely 的代理程序,专门用于检测实时互动中 AI 辅助的作弊行为。
Truely 实时监控会议,一旦检测到可疑进程(即使这些进程在通话开始前就已启动),每 10 秒就会发送警报。警报内容可完全自定义,若发现异常情况,系统还能自动终止会议。
目前仍处于测试阶段。若想体验,您可以查看 GitHub 仓库或申请访问权限 。

我们为什么要讨论这个?
因为真正的故事不在于技术本身,而在于它揭示了我们所处的时代真相。
我们已进入一个信任不再理所当然的世界。人工智能渗透进你的社交关系、收件箱、视频通话。悄无声息却无孔不入。像 Truely 这样的工具应运而生,只因我们已无法默认正在对话的就是对方本人。
无论情愿与否,诚实已成为我们需要验证的东西。
本周内容到此结束。我们学到了什么?
-
生成式视频正迎来转折点。曾经制约其发展的瓶颈正在迅速瓦解。
-
上周是 MAI-DxO,这周轮到 Chai-2。由智能体驱动的科研成果正在实验室和诊断领域崭露头角。