人工智能如何让我们成为更优秀的决策者——对话 Cassie Kozyrkov

客座主持人乔恩·福特与谷歌前首席决策科学家卡西·科兹尔科夫探讨人工智能如何改变决策方式。
大家好,欢迎收听 《解码者》!我是 CNBC 记者乔恩·福特,既是《收盘铃:加时赛》的联合主持人,也在领英平台制作《福特诺克斯》流媒体系列节目。这个夏天我将客串主持几期 《解码者》 节目,原主持人正在休育儿假。我们对正在筹备的内容感到非常兴奋。
在我主持的首期 《解码者》——这档探讨人类决策机制的节目里,我想邀请一位专家对话。因此我请来了人工智能咨询公司 Kozyr 创始人兼 CEO 卡西·科兹尔科夫,她曾任谷歌首席决策科学家。
欢迎收听由 The Verge 科技网尼莱·帕特尔主持的 《解码者》 节目,这里探讨宏大构想——以及其他难题。点击此处订阅!
长久以来,卡西深入研究决策的方方面面:不仅包括决策框架,还涉及底层社会动态、心理学,甚至在某些情况下探讨人类大脑如何及为何促成特定选择。这个被她称为”决策智能”的跨学科领域,融合了从统计学、数据科学到机器学习等各类知识。她的专业能力使其在谷歌担任高级顾问,近十年来帮助公司更智能地运用数据。
近年来,她的工作与人工智能领域产生交集。正如你将听到卡西解释的那样,像 ChatGPT 这样的生成式 AI 系统,使得获取建议和分析变得前所未有的便捷和经济。但除非你清楚知道自己寻求什么,以及决策背后的价值取向,否则从 AI 获得的只会是一堆杂乱无章的数据。
我和卡西深入探讨了决策背后的科学原理,它与现代 AI 行业的交汇点,以及她目前在 AI 咨询领域的工作如何帮助企业更明智地运用这些工具做出无法简单外包给代理或聊天机器人的决策。
我还想了解卡西个人的决策框架,比如她如何决定研究生阶段的研究方向,为何选择离开学术界加入谷歌,又在生成式 AI 浪潮兴起之际决定自立门户。这部分内容非常有趣,相信你会喜欢。
好了,有请决策科学家卡西·科兹尔科夫。我们开始吧。
为保持篇幅和清晰度,本文稿经过轻微编辑。
Cassie Kozyrkov,欢迎来到 Decoder。我也要欢迎自己加入 Decoder,毕竟这不是我的播客。我只是在愉快地操作这些按钮,但这一定会非常有趣。
是啊,能和你一起在这里太棒了,Jon。看来我们两个朋友成功潜入并接管了这个播客,我已经迫不及待想看看我们要在这里制造什么恶作剧了。
那就让恶作剧开始吧。作为谷歌前首席决策科学家,我想这已经说明了你擅长的领域,我们接下来会探讨 AI、领导力、技术等方面的深远影响。但首先,让我们从基础问题开始:做决定到底难在哪里?
这取决于决策本身。有些决定做起来非常简单,而我给人们的建议之一就是:除非你是专门研究决策学的学者,否则首要原则应该是让决策投入的精力与决策事项的重要性相匹配。当然,如果你是学生,你可以纠结于”如何用决策理论方法来选择午餐的三明治?”但现实生活中可别这样,对吧?
放慢节奏、仔细思考、认真权衡重大决策并全力以赴——这些行为依然只适用于那些会影响你人生的重要决定。更关键的是,当决策可能影响成千上万乃至数十亿人的生命时(这正是规模化技术带来的情形),就更需要这种审慎态度。
听起来你部分想表达的是:了解决策事项的重要性本身就是做决定时首先要面对的难题之一。
确实如此。而且了解你的优先事项也很重要。关于当今大型语言模型聊天机器人领域的人工智能,我觉得最引人入胜的一点是,它让获取答案变得极其廉价。当答案变得唾手可得时,问题本身就显得尤为重要。因为过去在做出那些重大、棘手的数据驱动型决策时,通常是决策者先提出想法,然后让数据科学团队去研究。等团队带着答案回来时,运气好的话可能是一周,但也可能是六周,甚至六个月。
然而在那段时间里,你其实有机会思考自己提出的问题,厘清它对你的真正意义,或许还能重新发问。那时人们还有酝酿”淋浴灵感”的余裕——就是那种”天啊,我当初不该那么表述”的顿悟时刻。但如今,你可以直接让人工智能尝试作答,几乎瞬间就能获得答案。
如果你习惯于立即朝着答案的方向行动,你就不会充分思考:”我该如何验证这确实是我需要的、对我有益的东西?我最初真正问的是什么?如果你愿意的话,世界模型是什么?做出这个决定时有哪些假设?”所以关键在于优先级,关键在于知道什么是重要的。
不过在我们深入之前,先停留在最基础的层面:人们是如何学会做决策的?有一个基本理念是,如果你碰了热炉子,一次之后就知道不能再碰了。但我们大脑中的神经连接是如何运作,教会我们成为决策者并发展出自己的决策流程的?
哦,我没想到你会把我神经科学的学位扯进来。那都是很久以前的事了。我要向任何真正从事神经科学研究的同行们道歉,接下来可能会冒犯到你们。但至少在我读研的时候,我们掌握的模型显示,人类拥有多巴胺能中脑系统——这个区域对运动功能和执行某些本能行为(或者说由基础奖励驱动的行为)至关重要,比如对糖分的渴望、逃避痛苦这类奖赏机制。
因此,你拥有一个可以视为进化上更古老的结构。运动和决策在大脑中的控制方式如此相似,这不是很奇妙吗?运动是一种决策吗?采取行动和做出决定是同一回事吗?我们可以深入探讨这一点。此外,前额叶皮层中还有其他结构。
通常,你的腹内侧和背外侧前额叶皮层会参与各种你认为需要费力或放慢速度的决策——比如凭感觉选股票(你自己可能都说不清原因)与坐下来真正计算数据、做些研究、整合所有信息并深思熟虑该怎么做之间的区别。
从广义上讲,不同进化阶段的脑区共同参与决策过程。前额叶皮层是相对较新的结构。这些系统有时协调运作,有时则存在些许冲突——它们共同构成了我们的决策机制。但当时我们真正关注的是要摒弃科普作品中那种卡通化的简化描述,即认为某个脑区只负责单一功能且仅执行这一功能。
相反,这是一个不断接收输入并处理所有信息的完整网络。因此,记忆当然会参与决策过程,想象能力也是如此——你会更多地联想到视觉枕叶皮层的活动——这些都会以某种方式参与其中。所以这是一个完整的系统,是执行人类决策的整个激活网络。乔恩,总结来说,神经科学家根本不知道我们如何做决策。这就是有趣的结论,对吧?
我们能做的就是不断试探和探究,试图理解一二,但归根结底,人类决策的实际核心机制仍是个谜。更有趣的是,人类自以为清楚自己的决策过程,但往往你可以在实验中——我称之为”受害者”的参与者们毫不知情的情况下——暗中植入某个决定。某些输入信息以某种方式被预先设定,那个决定其实早已替他们做好了。
They thought they made a decision, and then afterward you ask them, so why did you pick red and not blue? They will sing you this beautiful song, explaining how it was their grandmother’s favorite color or whatever it is. Meanwhile, the experimenter implanted that, and if you don’t believe me, go see a magic show. It’s the same principle, right? Stage magicians will plant decisions in their audiences so reliably, otherwise the show wouldn’t work. I’m always fascinated by how seriously we take our human ability to know and understand ourselves and feel as if we’ve got all this agency side by side with professional stage magicians entertaining crowds every day.
但在我看来,真正驱动决策的或许是我们内心的渴望——我们想要什么,而大脑中负责动作和运动的区域可能与此相关。当我们还是婴儿或蹒跚学步时,所做的决定无非是:我要不要爬起来?我饿了吗?要不要哭?这些都是与生理需求相关的基本选择,毕竟那时候我们还算不上有思考能力的个体。
要有决策可做,首先你得有某种愿望或目标,对吧?无论我们是否清楚自己真正的动机是什么,这都是关键要素——在决策过程中拥有某种愿望或目标。
这取决于你如何定义它。在研究社会生物科学中的决策时,你必须先选定一个词,比如”决策”——这个词我们平时可以随意使用——然后你需要给它一个明确的界定框。就像数学题开头写”设 X 等于…”一样,你可以设 X 代表光速,那么之后只要我写 X,就代表光速。而另一个人的论文里可能设 X 等于 5,那么他写的 X 就代表 5。
同样地,我们会说”设决策等于……”然后根据目的来定义它。通常决策分析师对决策的定义——就像他们在文件开头写”设决策等于……”那样——会说这是对资源的不可撤销分配。接下来就需要你自己思考:如何定义”分配不可撤销”的含义,以及”资源被分配”本身意味着什么。
这是必须由人类做出的行为吗?这是否可能是人类下游系统做出的行为?什么是资源?资源仅仅是金钱,还是可以包括时间?或者机会?例如,如果我选择穿过这扇门会怎样?此刻,在当下这个宇宙里,我没有选择穿过那扇门,也无法回头。因此从这个意义上说,我们每一个动作都是对资源不可撤销的分配。
在企业中,如果你是谷歌,要不要收购 YouTube?这在那时可是个重大决策。我该聘用这个人还是那个人?如果是关键岗位,这个选择可能直接决定公司的成败。我要投资人工智能吗?现阶段要不要采用这项技术?
没错,你可以选择如何界定这个决定,使其在定义上不可撤销。比如我现在决定聘用乔恩,可能就意味着要放弃其他事情——比如没法安心吃三明治,得处理一堆聘用文件。所以我可以认为这个决定不可逆。但如果我聘用了乔恩,明天也能解雇他,释放出比时间和当前机会更重要的资源。这样我就可以把这个决定视为双向门。
所以关键在于你如何界定问题框架,其余部分自然会体现在决策逻辑中。心理学中思考决策的重要方式,就是将其分解为判断与决策两个环节。
判断力与决策制定是两回事。当你费尽心思决定如何做决定时,判断力就派上用场了。对你而言,以无法反悔的方式分配资源究竟意味着什么?这需要决策者深入思考。我们要衡量什么?什么才是重要的?我们究竟该如何处理这个决策?
即便说出”这个决定应该凭直觉而非费力计算来做”这样的话,本身也是判断过程的一部分。而随后的决策过程,不过是在执行你先前设定判断框架时必然产生的数学结果。
说到框架设定,能描述下典型场景吗?客户通常为什么雇佣你?他们处于怎样的处境时会觉得”好吧,我们需要一位决策科学家”?
通常来说,重大决策往往涉及 AI 系统的部署。该如何考虑用 AI 解决问题?这是个重大抉择。我是否真该启用这个 AI 系统?很可能要彻底替换现有方案。比如当我已经拥有软件开发者手工打造的系统,并且运行效果尚可时,绝不会贸然引入 AI 然后祈祷好运。当然某些情况下确实会这么做——比如为了宣称”我们是 AI 公司”,这时除非被劝阻,否则会默认部署 AI 系统。
但通常这个过程既费力又昂贵,我们得确保它足够好,并且适合那家公司的具体情况。那么,我们该如何衡量这一点?又该如何考虑实际构建时的种种现实问题,以确保它具备我们推进项目所需的所有功能?这个关于人工智能的决策,可是个重大决定。
领导或公司的价值观在这种评估中有多重要?
令人难以置信的是,我认为这正是人们在面对看似数据或数学情境时常常忽略的关键。一旦涉及那点数学运算,事情就显得客观了——仿佛”从这里开始,必然到达那里”,似乎只存在唯一正确答案。但我们忘记的是,那点数学、数据和代码构成的客观性,不过是夹在厚厚主观性三明治中的薄薄一层。
第一层主观选择是:究竟什么重要到值得自动化?什么重要到值得优先实施?我想改进什么?我希望把企业引向哪个方向?什么对我至关重要?什么对我的客户至关重要?我想如何改变世界?这些问题都没有唯一正确答案,但必须清晰阐明,后续工作才有意义。
企业通常通过使命宣言来表述这些理念。但根据我的经验,这些宣言往往不够详尽,难以指导人工智能将引领我们深入的那一系列细致而复杂的事件进程,不是吗?
确实,这一点至关重要,它延伸出关于如何思考决策授权的整个议题。领导者首先需要认识到,当处于组织权力链顶端时,他们根本没有时间参与过于细枝末节的决策。事实上,其核心工作在于:如何将决策权下放给其他人;若要将决策委托给自动化系统,则需要选择值得信任的人或可信赖的方案;最后要学会对具体决策放手。
你不会想让 CEO 去操心诸如公司新 AI 系统中网络安全细节这类具体问题。但企业作为组织需要确保:项目中有人负责考量所有需要关注的环节,并且这些职责都授权给了合适的人选。因此我的部分职责就是不断提出关键问题:什么是重要的?谁能胜任?如何统筹全局?以及如何确保我们没有盲区或遗漏任何环节?
客户通常有多愿意提供这些信息?这是他们习惯进行的对话吗?
诚然,我们已经取得了长足进步,但作为运用数据的文明,在很长一段时间里,我们沉迷于单纯实现技术可能性本身,甚至不去思考其用途。我们总惊叹:”能移动这些数据多酷啊!””能从中提取模式多厉害!””能大规模存储收集数据多棒!”却从未真正自问:”我们究竟要走向何方?又该如何运用这些技术?”
我们正在走出那个痛苦的发展初期——那时人人都沉浸在”这很有趣,让我们为理论而研究”的狂热中。这就像在说:”看,我们发明了轮子,现在能造出更好的轮子,还能把它升级成轮胎,裹上橡胶,甚至用碳纤维来制造。”
如今我们开始思考:”这项技术确实能带来变革,不同投入能产生不同速度的进步——但我究竟要去往何方?如果目的地就在两码开外,那我其实根本不需要汽车,也不必为汽车本身而痴迷。”
但如果我真正需要的是明天抵达邻近城市,而目前又没有车,那么我们也不会讨论通过聘请研究人员从零开始发明汽车。我们不会考虑内部制造。我们会问:“谁能提供符合要求且准时送达的解决方案?”这类对话虽是新事物,但正是我们前进的方向。我们必须如此。
听起来——如果我理解有误请指正——人工智能在提供事实和选项方面会给予我们更多帮助,而在提供价值观和目标方面则作用较小。
但愿如此。这正是我们的期望,因为当你从 AI 那里获取价值观和目标时,实际上是在获取互联网的平均值,或者某个在其输出逻辑上运行了更多规则的系统所提供的内容——这时你获取的价值观和目标可能更偏向于设计该系统的工程师们。这就好比说:”如果我每次都用 AI 作为初稿,那份初稿可能就少了一些’我’的成分,而多了一些文化大杂烩的平均味道。”如果所有人都开始这样做,那确实会导致我们的见解趋于同质化或平均化。
或许你希望如此,但我认为让那些熟悉自身问题领域、贴近业务实际、拥有个人专长的人,在行动前稍作思考并真正明确问题所在,而非直接从 AI 系统中获取答案,仍具有重要价值。
乔恩,对你来说情况可能是这样的:你可能会问一个 AI 系统,”怎样才能过上最美好的生活?”它会给你一个答案,但这个答案并不适合你。问题就在这里——它给出的会是适合普通人的方案。但究竟什么是”普通人”?这个标准又该如何套用在你身上?
它会去 Instagram 上查看哪些人获得的点赞和粉丝最多,然后认定这些人拥有最理想的生活,接着提取这些人的特征——他们的外貌、谈吐、自称的教育程度——最后告诉你:数据表明大众认为这些人过得最好,所以你应该效仿他们。你想表达的是类似这个意思吗?
差不多是这样,但实际更复杂。需要认识到的是,机器相比人类具有记忆力和专注力的优势。比如我现在屏幕上闪过50个数字然后让你回忆,你肯定毫无头绪。但系统可以调出这50个数字说:”看,机器帮我们完整记住了,它的记忆力明显比乔恩强多了。”
接着我们快速展示这些数字,我说:”快,这些数字的总和是多少?”这对你来说很难,但对机器却很简单。因此,任何我们讨论时能装进脑袋里的东西,相对于拥有大规模记忆和注意力时真正可能实现的功能而言,都只能算是个简化版。换句话说,我们刚才描述的 Instagram 处理流程虽然现在能装进我们脑子里,但你要明白这些系统实际运行的机制庞大到我们根本无法完全理解。
诚然,Instagram 和其他一些渠道,甚至某些关于如何过好生活的网站确实会影响我们,但这些信息全都混杂在一起,复杂到我们难以理解其本质。关键在于,这些内容并非为我们量身定制——除非我们投入大量精力去提供个性化所需的信息,而这正是我鼓励大家去做的。
当然,现在获取建议的成本比以往任何时候都低。我会把任何感兴趣的内容整理好输入系统。当然,我会剔除最机密的细节,但针对我的具体情况和个人偏好——比如如何优化看房策略——我咨询过各式各样的问题。相比简单询问”该怎么投资”,我得到的答案会截然不同。我甚至改进了些看似愚蠢的小事,比如发现自己系鞋带太紧。多亏了 AI 提醒,现在我掌握了让双脚更舒适的小技巧。
你是否通过 AI 发现自己鞋带系得太紧了?
是啊,我去做了个调试。我想找出脚疼的原因。为了辅助诊断,我向系统提供了大量个人信息,比如脚疼的时间点、当时在做什么活动、穿的是哪双鞋。我们走了一遍调试流程:”好,首先尝试改变你惯用的系鞋带方式——你原来那套先绕圈再松一点的系法。”结果发现:”哇,现在脚不疼了,太神奇了。”
所以无论困扰你的是什么问题,都可以用 AI 试着调试看看。可能有用,也可能没用。但如果你只是空泛地提问”怎样才能最健康?”,系统大概率不会告诉你该调整鞋带系法,只会反馈些经过过度平均化处理的泛泛之谈。
要想获得有用的东西,你必须有所贡献。你需要清楚什么对自己重要,明白自己想要达成什么目标。有时候,就像我当时的反应一样,仅仅因为此刻脚疼,这件事对你来说就变得很重要。我大概不会主动询问关于鞋带的问题,但有时真正有帮助的是退后一步自问:”我生活中现在有哪些方面可以改善?那为什么不寻求建议呢?”
人工智能让获取建议的成本降至历史新低,这才是重大变革。它还能提供各种细致入微的建议,比如帮你梳理决策框架——”帮我理清思路,引导我提出那些对做出某个决定至关重要的问题”。
大多数人在决策时最容易犯的错误或最大的盲点在哪里?是提出正确的问题吗?是确定自己想要什么吗?你认为最关键的是什么?
首要问题是没有明确自己的优先事项。当你对自己的优先事项不清晰时,任何人的建议——即使来自最优秀的人——也可能对你不利。这一点同样适用于 AI 领域。如果我们不清楚自己的需求和愿望,只是让 AI 给我们一个普通的初稿然后严格照搬,它真正适合我们的几率能有多大呢?
让我用一个具体情境来说明,因为我是一个即将17岁、高中二年级下学期学生的家长,孩子正准备申请大学,这是年轻人面临的第一个重大决定。这个决定是双向的,充满了压力:一方面你要决定申请哪些学校,另一方面学校也在决定录取谁。
这种情况似乎也适用于此,因为有些人选择申请某所学校,可能仅仅因为父母曾就读于此,或是冲着常春藤盟校的光环。那么从这个角度出发,你能谈谈高中生申请大学时容易犯哪些错误吗?
我会继续尝试将这些观点与我们使用 LLMs 的互动经验联系起来,因为在这个使用 AI 工具的勇敢新世界里,这种关联对人们很有帮助。再次强调,整个过程大致分为三个阶段:首先需要确定什么问题值得问、什么事情值得做;其次要获取建议或技术协助来完成执行环节——执行者可能是你自己、LLM 系统,也可能是给你宝贵建议的父亲;最后当你收到建议时,必须花时间评估它是否真正适合你——我该采纳吗?这是好建议还是坏建议?我是否应该实施并执行它?这三个阶段缺一不可。
首先,最令人不安的一点是扪心自问:”我该如何准确界定自己的诉求?”具体到孩子身上,可以转化为:上大学对我的意义是什么?我为何要思考这个问题?我期待获得什么?这所大学与那所大学能带给我哪些不同体验?哪些因素会造就这些差异?我的核心诉求是什么?这些诉求为何成为我的优先考量?
这些问题若与你内心的答案不符,你将从各处——文化、网络、父亲那里——获得建议,最终很可能做出对他们有利而非对你有益的选择,这一切都源于你没有足够地自问那些根本性问题。
这就像魔术师的手法。他们在潜意识里给你灌输一个答案,而你最终会不假思索地复述出来,甚至没意识到那并非你真正想要的。
就像我父亲常说的那样,你爸爸可能也会告诉你经济学是门既有趣又酷的学科。这个想法在我13岁左右就深植脑海,始终挥之不去。正因如此,我最终走进了经济学课堂,并在芝加哥大学主修了经济学专业。
当然,父母灌输的价值观未必总会生根发芽——我双亲都是物理学家,但我很快就发现自己对物理避之唯恐不及,因为他们总念叨”你物理该学得更好””你该多修物理课”。结果呢?大学叛逆期过后,我在神经科学研究生课程里反而选修了物理。你看,人生就是这么兜兜转转。
但关键在于,你必须清楚自己想要什么、什么对你真正重要,并时刻保持这种觉知,这样才不会被别人的建议左右——即便是那些看似最完美的建议。重点在于:即便最优的建议也可能对你不利。当你认为某人专业可靠,就理所当然该采纳其建议时,这种想法本身就是误区。因为如果对方重视的与你重视的并不一致,而你又未能清晰传达诉求,或对方并未将你的核心利益放在心上,那么再睿智的建议都可能将你引向深渊。我想强调的是,AI 或许是个高效系统,但若你未为其提供助力决策的上下文,它同样无法真正帮到你。
这正是我想探讨的 AI 话题,我觉得你之前也提到过这一点。AI 总是表现得极其自信且能力超群——根据我观察到的实际输出结果,它几乎不会表现出不确定性。它从不会说”呃,我不太确定,但我觉得可能是这样”(当它即将产生幻觉时),而总是直接给出”这就是正确答案”的绝对肯定答复。几乎百分之百的时间里,它都表现得无比确信。
这是一种设计选择。当 AI 输出中存在真实的概率阶段时,你可以转而呈现与置信度相关的内容,这可以通过多种不同方式实现。对于某些模型(甚至包括一些基础模型),其运行机制是首先获得概率值,然后将其转化为用户最终看到的行动或其他情境下的输出。
例如在后台系统中,你可以多次运行这个系统并提出问题:”二加二等于几?”然后在后台运行100次后,你会发现其中99次返回的答案都包含数字四。这时你就可以展示某种置信度指标,表明这至少是当前文化共识认为的正确答案,对吧?
让我们来问一个问题:”澳大利亚的首都是哪里?”如果文化大环境不断告诉你错误答案——比如说是墨尔本(其实不是),或者悉尼(也不是,对感到意外的人来说,正确答案是堪培拉)。但假如文化大环境里多数人都说是悉尼,而我们仅从这种文化共识中获取信息,没有额外调用逻辑去专门查阅维基百科这类可靠来源,那么你就会得到一个被高度确信的错误答案。不过这种确信度本身是可以被量化的。
在文化共识不够明确的情况下,你会得到各种不同的反馈,经过平均处理后就可以说:”目前展示的内容只出现在20%或10%的案例中。”甚至可以详细说明:”这是最普遍的答案,此外还有这些其他答案。”不这样做很大程度上是用户体验设计的决策,同时也涉及算力和硬件成本的考量。
这也是个文化层面的问题,不是吗?
这是个文化问题。
在我看来,在美国——或许许多西方文化都是如此——我们崇尚自信,有时甚至把确定性看得比正确性更重要。
商业界存在这样一种文化:直到公司倒闭前的最后一刻,我们都期望 CEO 能宣称”我非常有信心我们会成功”,因为人们愿意追随充满自信的领导者。然后第二天他们改口说”啊,好吧,我失败了,事情没成”。我们居然能接受这种说辞,还觉得”至少他们尽力了,而且当时确实很有信心”。
体育界也是如此,对吧?七局四胜制的比赛中某队1:3落后,这支只赢过一场的队伍会说”我们非常有信心能翻盘”。实际上统计数据表明他们大概率会输,但我们明白他们必须保持自信才有一线生机。所以我们接受了这种现象——某种程度上,我们正是以这种自我投射的方式创造了人工智能。
我们确实按照自己的形象创造了人工智能。这其中涉及大量用户体验设计,但我认为这并非必然结果。一方面,我知道存在所谓的”流畅性启发式”概念——当一个人或系统表现得越流畅、越少犹豫和不确定,就越容易被认为值得信赖。这项心理学研究早已有之。
现在你明白了,流畅性启发式是完全可被操控的。因为如果你忘记自己面对的是一个具备某些优势的计算机系统——比如记忆力、专注力,当然还有流畅性——你很可能会不假思索地快速说出一堆自己都不理解的废话。而这在用户或听者眼中却显得专业可靠,从而转化为更高的可信度。所以我们的流畅性启发式完全能被机器系统操控。作为人类,我很难做到这一点。虽然我们确实有艺术家能做得很好,但要对你完全不了解、连词汇组合都毫无概念的话题流畅发言是非常困难的。这种情况只有在”盲人领盲人”的场景下才成立——房间里其他人也对相关领域一无所知。
另一方面,我得说至少对我而言,这种直率确实为我的职业建立了口碑——我向来实话实说,不知道就是不知道。你问起神经科学时,我就坦言研究生毕业太久知识生疏了。或许该调整下表达方式?我确实会这么做。当然这不适用于所有市场。很多人可能会想”她根本不知所云,或许不该和她合作”,但我的方式确实有其价值,而且我确信这让我在历练中变得更可靠且值得信赖。
话虽如此,在设计人工智能系统时,这种犹豫不决的缺乏自信不会带来良好的用户体验。但同样地,我在这里谈到的一些功能在计算资源上会非常昂贵。我在人工智能行业经常看到的情况是,商业人士认为某项技术不可行,仅仅因为它没有被提供给用户,尤其是没有大规模应用,甚至没有向企业提供。但很多时候,这在技术上是完全可行的。只是提供该功能无利可图。没有合理的商业案例。也没有迹象表明用户会以使其物有所值的方式做出回应。
因此,当我谈到将某件事运行 100 次然后输出类似置信度分数时,你需要决定是运行 100 次、10 次还是 1000 次——这取决于一系列因素,当然,如果这是企业正在解决的问题,我们可以深入探讨。但仅从表面来看,我实际上说的是计算量增加了 100 倍,对吧?运行 100 次而非一次,为了什么?用户会对此有反应吗?企业会在意吗?是的,你常常会对现有技术已能实现的效果感到惊讶。像[OpenAI 的]Operator、[Anthropic 的]Claude Computer Use、[谷歌的]Project Mariner 这类智能体,它们目前的性能都低于潜在水平,这是有意为之,因为充分运行它们的成本很高。所以当企业和用户愿意为这些能力支付更多时,将会非常令人兴奋。
现在请给我回顾一下,因为你大约两年前离开了谷歌,准确说还不到两年。你在那里工作了大约 10 年,远在 OpenAI 和 ChatGPT 掀起全球 AI 热潮之前。但你当时已经在研究相关领域的一些东西了。所以我想了解你在谷歌的工作内容,以及是什么让你进入这个领域的。
我记得你说过,父亲在你13岁时首次向你提及经济学,这听起来年纪很小,但我想你几年后就上了大学。那时你其实已经在为学业做准备了。是什么促使你那么早决定上大学?你的动力是什么?
我们很少谈及的一点是,了解一个人的动机比任何其他方式都更能揭示其本质。因为如果你只是观察结果,并不得不自行推断他们如何达成、做了什么、为何这样做——尤其是在存在幸存者偏差的情况下——他们可能看起来像十足的英雄。但当你审视他们实际的决策过程时,可能会发现截然不同的真相;或者你可能认为某人并不成功,却没意识到他们在追求与你完全不同的目标。绕了这么大圈子其实是想说——乔恩,很高兴我们是朋友,所以我愿意分享——但这始终是个非常私人的问题。没错,我为什么那么年轻就上大学?说实话,是因为我在小学时跳级了。
我在小学跳级的原因是因为我回到家——那时我大概九岁——告诉母亲我想这么做。我记不清为什么了,真的完全想不起来。那只是九岁小孩的一时兴起,而且在我成长的南非,跳级并不常见。所以我父母不得不与学校甚至教育部门据理力争才获批准。就这样,我12岁就上了高中,其实我很享受年纪小的感觉。没错,会受点欺负,但我乐在其中。我喜欢发现你能从年长者身上学到很多东西,虽然当时不像现在这样理性分析,但确实能从比你年长的人那里获益良多。
它们能推动你前进,而我深信被一群能推动你的人环绕的力量——这可能是我认为在人工智能时代大学仍有意义的最大理由。去一个所有人都在自我提升旅程中的地方吧。13岁时我领悟到这点,开始和12年级的学生交朋友;14岁时他们都已毕业进入大学。我把大部分时间都花在这些年长的伙伴身上,如今却陷入孤独,只想找回我的朋友们。这就是我如此年轻就上大学的原因——完全是一个青少年被社交本能驱使,渴望身处同龄人群体中,这种……
但要对自己公平些。听起来你只是想看看这辆车能跑多快,对吧?这就是九岁时的一部分心态。你意识到自己能应对比现有挑战更大的考验。所以你有点像是,”好吧,让我试试看”。然后你去尝试了,发现自己在智力层面确实能驾驭。可能有人会说:”但社交方面会很困难吧”,而你会想:”嘿,我有高年级的朋友啊,这部分也没问题。那让我看看能不能用大学的速度来驾驶这辆车。”这也是原因之一,对吗?
“你做不到 X”这种话太容易刺激到我了。真的太容易了。我立马就会想:”不,让我证明给你看。我就喜欢挑战。咱们把这事搞定。”所以没错,我觉得你的评价很对。
那么你在芝加哥大学毕业后继续深造,攻读神经科学研究生课程,同时也涉及一些经济学内容?
实际上我去了杜克大学攻读神经经济学。这就是那个领域。你知道有宏观经济学和微观经济学对吧?而这个就像是纳米-皮可经济学。它研究的是大脑如何实现决策过程。所以课程自然包含实验微观经济学——这是其中一部分内容,但这个项目隶属于心理学和神经科学系。严格来说,这是心理学与神经科学的硕士学位,专注于决策的神经机制研究,也就是所谓的神经经济学。
我还读了两次研究生院,这铁证如山说明我是个糟糕的决策者——免得有人以为我本人很擅长这个。朋友们,我只是掌握了技巧可以指导你们。但说真的,两次读研经历其实对我很有益。第二次我专攻数理统计,本科时学的是经济学与统计学。后来转向数理统计方向,当时做了大量我们现在称之为 AI、当年还叫机器学习的研究。
这过程中涉及了多少个博士学位呢?
[笑] 在打造我这个人的过程中,没有任何博士学位受到伤害。
好的,但既然同时修习这两个学科,你原本打算用它们来做什么呢?
回到大学时期,尽管我主修的是经济学和统计学,但我选修了一些关于决策制定的课程。这让我尝到了甜头。我来告诉你为什么选择统计专业吧。选择统计是因为大约八九岁时,就在跳级之前,我发现了世界上最美好的东西——众所周知,那就是电子表格。对我来说那是最美妙的事物。或许这是图书管理员那种想要将混乱归整的本能在作祟。
我曾收藏过一批宝石,纯粹是为了能在电子表格里多添一行数据。这就是全部意义所在。得到一颗紫水晶时,我会想:哦,它是紫色的,硬度如何?还是半透明的。尽管这完全不是我的专业领域,但我至今仍觉得,配上一杯好酒来录入数据,实在是件令人愉悦的事。
于是我开始和数据打交道。一旦你开始收集数据,就会发现自己也忍不住要摆弄它。你会冒出各种冲动念头,比如”啊,要是能把电脑里所有文件数据都整理成电子表格就好了”,然后就开始琢磨怎么实现。就这样我自学了点编程,免费掌握了一堆数据处理技能,还觉得数据特别美。我以为统计学肯定能轻松拿高分,哪知道这其实是门哲学课——那些哲学部分要么让你醍醐灌顶,要么说明你根本没入门。当然,摆弄数据本身简直易如反掌。随着逐渐领悟其中的哲学内涵,我意识到统计学本质上是在不确定条件下改变认知的学问。
经济学是研究稀缺性的学科,涉及稀缺资源的配置。即便金钱并不稀缺,某些资源总是有限的。人类生命有限,时间就是稀缺资源。因此”你将如何进行资源配置,或者说如何决策?”这类问题正是通过经济学视角提出的。诸如”如何改变想法?你的思维模式倾向于什么?有哪些可行方案?需要什么条件才能让你改变主意?”
我开始思考这些问题:在人类这种生物身上,决策机制究竟如何运作?又该如何优化?这些疑问源自我的心理学与神经科学研究背景。当时我正从各个角度研究决策机制,像仓鼠囤粮般贪婪积累知识。那么,我是否清楚自己将从事什么职业呢?实际上周围人都在劝阻我。在芝加哥大学——即便是这样崇尚通识教育的地方——我的本科导师曾说:”我真不知道你学这些乱七八糟的东西将来能找什么工作。”
我说:”没关系,我正在学习。我觉得这挺重要的。”当时我没能像现在这样清晰地表达——数据固然精美,但数据本身不包含”为什么”。那个”为什么”来自决策者,对吧?目的必须由人来赋予。无论这个目的是你个人的,还是你所代表群体的,正是它赋予其他一切以方向。所以单纯研究数据时,总觉得存在标准答案,因为教授设置的问题本身就预设了标准答案。如果他们换种方式设置问题,答案可能就完全不同了。
意识到问题设置存在无限可能性,这才是赋予数据”为什么”和意义的关键。这才是决策的核心所在。我认为这是我们每个人都最值得花时间思考的事。尽管我们确实都在为此投入时间,只是各自通过不同的视角来接近它。
那么为什么选择谷歌?为什么你曾发誓不会在一家公司工作超过十年?
好吧,我们真的要深入探讨所有细节了。谷歌是个有趣的选择,现在我要说些从未在任何播客中透露过的事。真实情况是,当时我正在攻读数理统计博士学位,却不知道我的导师——那时在北卡罗来纳州立大学——刚接受了伯克利的聘约,而按规定他不能带走任何学生。这对读博中期的我简直是晴天霹雳。
当时我对导师调动毫不知情,但万圣节对我来说可是件大事。在 Kozyr 公司,这天是带薪假日,员工可以尽情享受节日。那天我穿着打孔卡戏服(就像用标准 Fortran 语言打印”万圣节快乐”那样操作) 去听谷歌工程师的讲座,全场就我一人盛装出席——毕竟其他人都太无趣了。
把这句话记录下来。我以前的同学们本该穿戏服的,但我们还是可以做朋友。于是早上 9 点,我就这副打扮。那位谷歌女员工跟系主任聊天时说:”那个穿得像打孔卡的研究生是谁啊?”系主任虽然没见到我,还是说:”哦,那大概是卡茜吧。去年她还扮成 σ域呢”,纯属测度理论的梗。可见我当时有多书呆子气。那位谷歌员工心想”文化契合度满分”,当即决定要收我的申请。
当时申请的是暑期实习,看起来是个无害的选择。当然,试试看吧,就当是场冒险。那可是谷歌啊。就在我报名时,导师对我说:”这对你非常有利。根本不用犹豫。别问我是否希望你留校做暑期研究。一定要去谷歌。你可以在那里完成博士学位。”后来的事大家都知道了。这比换新导师重头开始要好太多太多了。
你是如何成为数据人员和决策者之间的桥梁的?
我在谷歌最终获得的职位,正式实习名称是决策支持实习生。我心想:”支持的部分我们可以搞定,实习生的身份也能适应。”但决策 ——这才是我毕生训练的核心。我所在的团队就像数据驱动决策的特警小队,与谷歌的核心营收紧密相关。这支由统计学家组成的团队自称决策支持小组,行事极其严谨,融合了硬核统计学与数据科学,还配备了一个同样硬核的工程组——规模相当庞大。在那里我收获颇丰。
在博士导师的强烈建议下,我申请了留在原团队担任全职职位,当时以为自己会加入那个团队。但发生了一个小插曲——在前往山景城之前,我在纽约市度了个周末,顺便选好了公寓。我原以为自己会加入这个团队,一想到能置身于我所关注领域的顶尖专家之中,就感到无比兴奋。实际上这些专家更侧重于数据方向的工作,因为在谷歌那个部门,决策内容和执行方式都有严格规范。但这次纽约之行让我猛然醒悟——这是我人生中最震撼的决策顿悟时刻之一——我意识到自己正在犯一个可怕的错误:如果去山景城,我的人生乐趣将远不如选择纽约。
当时我完全是凭直觉行事,满脑子都是”天啊,我是不是该重新考虑这个决定?我真的会喜欢山景城的生活吗?”我一心只想着拿到 offer,却忘了真正该做的事——好好评估自己的优先事项。于是我做的第一件事就是打电话给招聘专员:”等等等等,能不能让我去纽约办公室?哪个团队都行,有没有适合我的岗位?”就这样我加入了纽约团队。项目类型截然不同,团队氛围也天差地别。在那里我发现,并非整个谷歌都采用那种刻板的决策方式。即便在谷歌这样的公司,那些离盈利链条较远的产品也需要大量本土化调整。
因此,关于资源分配的缘由、具体实施方式以及最终负责人等问题,必然需要展开更多讨论,对吧?当你能通过鼠标点击调动数十亿资金时,这类问题通常已有既定答案。但在谷歌其他部门,处理这类问题的方式则显得灵活多变得多,而负责资源分配的人员与我们可能参与的数据、工程或数据科学工作之间,又存在着巨大的鸿沟。
为了真正填补这一空白——架起一座桥梁,让这些技术发挥实际作用——我投入的工作量远超正式岗位的要求,致力于构建基础设施。我创立了早期的统计咨询服务,因为当时这一领域尚属空白。那时你找不到统计学家坐下来与你深入探讨项目规划。
我说服人们贡献出他们的 20%时间 ——按专业划分的统计人员——去支持不属于他们自己的项目,为此建立了一些框架结构,并为决策者提供了关于如何与数据人员打交道的资源和课程。我真心尝试将这两个领域融合在一起,最终这成了我的工作。但在很长一段时间里,这并非我的职责。有时我会面临质疑:你到底是什么人?你究竟是谁?你为什么要做这些事?但看到事情可以变得更高效、更人性化——对于那些专家来说,除非你先明确问题,否则他们就得处理定义不清的问题——这让我充满动力,这就是我坚持的原因。
试图将这一切串联起来,听起来价值观与目标的部分,以及你在学校提到的哲学要素的重要性正在重新发挥作用,而不仅仅是关注外部期望,比如去谷歌工作——你当然会去山景城。那里是权力所在。数据人才都聚集在那里,而你的聪明才智足以与数据人才为伍。
所以如果你打算让车尽可能快地行驶,你会选择那条路线,但你做出的决定可能与九岁的卡西不同。你退后一步思考:等一下,什么对我最有利?在整合其他信息的同时,我该如何实现这个目标?
当然可以。我想我们可以对你17岁的孩子说:没关系。年轻时难以认清真实的自己很正常。你尚未定型,或许让风稍微带你飘一会儿也无妨,尤其当你还有位能给予绝佳建议的出色父亲时。但如果你能逐渐养成这样的思考习惯会更好:”我并非泛泛之辈,那么我真正想要什么?”然后为那些公认的顶尖团队奋斗——无意冒犯谷歌内部同仁——但他们确实曾享有顶级团队的美誉。
如果你想成为第一,然后一次又一次地成为第一,那本该是你要走的路。但话说回来,也许人生中值得追求些别的目标。而我呢,其实是个戏剧迷,从小就是。我对戏剧痴迷到无可救药。两周后我要去伦敦待几天,打算每晚看演出,下午场也不放过。我要尽可能多地囤积戏剧来滋养灵魂。所以住在纽约显然更合适,不仅因为戏剧,还因为那座城市能提供的远不止于此。
曾在硅谷和纽约地区都生活过的我可以向你保证,没错,纽约的戏剧确实要精彩得多。
我是说,我也参加过硅谷所有的路演活动,做足了功课。我很清楚自己投身其中或抽身而退的缘由。但确实,要判断哪些问题值得提出,这需要实践经验和技巧。我从最初掌握方法论去帮助他人,到接受正规学术训练成为理论专家,逐渐培养了这种能力——知道该提哪些问题,按什么顺序提问。但若要将这套方法用于自我审视,向自己抛出尖锐问题,仅靠书本智慧是远远不够的,那完全是另一回事。
这对我们所有人都是很好的建议,无论是经营企业还是试图规划人生,我们都有决策要做。Kozyr 创始人兼 CEO、谷歌前首席决策科学家 Cassie Kozyrkov,感谢您参加本期解码器节目。
谢谢邀请我,乔恩。
