Google的Bard会成为一个目的地聊天机器人吗?
为什么它可能成功或失败,以及这对AI聊天机器人未来意味着什么
显然,没有人知道在Google如何写一个行动号召。
前几天,该公司推出了它最新的语言模型 Gemini,据说在某些基准测试上击败了 GPT-4。太棒了!但是却没有一个方便的链接让人们去尝试它。大多数公司在它们的产品发布公告上都会放一个巨大的“立即尝试”按钮,但Google却没有。
相反,我不得不在企业博客文章中寻找一个该死的方法来真正使用这个东西,就像在太平洋垃圾带中游泳一样。取消我的健身会员资格比获取它的聊天机器人更容易。
在向一个灭火器(嗯,我的 X 上的朋友)请教之后,我在文章中找到了一句话,解释说虽然 Gemini 立即在 Bard(Google的 ChatGPT 竞争对手)中可用,但它最高效的版本——击败 GPT-4 的版本——将在明年才会推出。Google爸爸给予,Google爸爸夺走。
在没有试用的选择的情况下,我阅读了所有内容并观看了视频,这样你就不必这样做(只因为这实际上是我的工作)——哦,天哪,真有一些有趣的东西。
Gemini 可以进行科学研究。它能够浏览过去几年发表的20万篇论文,找出哪些包含相关新科学的论文,提取研究结果,并根据所学到的内容构建一篇综述性文章。它在编码方面也非常擅长,并且它有一个漂亮的用户界面,可以在与它聊天时构建定制的软件体验。它能够比以前的版本做得更好,因为它有增强的能力提前规划任务。
当最强大的版本发布时,我们将看到它的表现如何,但 Gemini 提出了一个有趣的问题:
Bard 是否有作为目的地聊天机器人的未来?在其他Google产品的背景下,它几乎肯定有未来。换句话说,只要我使用 Gmail 或在 Chrome 中输入搜索,我将使用 Bard,因为它将被内置在其中。
但是,我或其他人会选择去 Bard 吗?现在,我用 ChatGPT 和 Claude 这样做。我还有空间再来一个吗?十个?多少聊天机器人会成为目的地?让我们来分析一下。
Bard之所以能成功
Bard能够成为一个热门选择有两个明显的原因。首先,它可以利用Google强大的分发能力,内置在Chrome、Gmail、Docs等产品中。因此,对于成千上万的人来说,这将是他们第一次接触人工智能体验,Bard也将因此获得所创造的习惯所带来的回报。
其次,它可以访问在Google中保存的你我的以及其他人的所有数据。我已经写了很多关于获取知识对LLM结果质量最重要的瓶颈的想法,而Google在这方面有着巨大的优势。Bard已经能够参考我所有的电子邮件和文档,这将极大地影响它的智能表达能力。
但还有第三个不太明显的原因,可能会使Bard成为一个热门选择。和聊天机器人交谈很像和朋友交谈。正如我手机上现在有197条未读短信(如果你是其中之一,抱歉),我同时和很多不同的朋友聊天。我们的大脑被编程成记住很多不同的人,并知道何时以及为什么我们可能想要和他们交谈。我有一小群人,每天都和他们发短信。还有一些稍微更多的人,我每周或每月发几次短信,计划一些事情或分享一些梗。还有更多的人,我只在特定情况下发短信。例如,有一个朋友,当YouTube上有新的牛排视频时我才发信息给他,但我们不谈其他任何事情。(男性之间的友谊很奇怪。)
著名的邓巴数是一个人可以同时维持的关系数量,通常是大约150个,关系的强度各不相同。
如果聊天机器人足够像人类,可以被放在处理人际关系的大脑部分,他们可能会与我们有类似的互动。这可能给Bard留下了空间,即使在ChatGPT继续领先的世界中也是如此。
但也有一些力量在对抗它。
Bard可能失败的原因
Google无法推出。OpenAI的大部分研究都发生在Google,但Google却搞砸了。正如我之前所写的,除了知识编排,阻碍LLM结果质量的另一件事是风险承受能力。愿意承担更多风险的组织将能够构建更好的人工智能产品。
Google无法承担太多风险,因为它是一家巨大的公司,它的每一个举动都会影响数亿人。大公司总是在重大技术转型中搞砸——想想iPhone时代的黑莓——所以微软与OpenAI合作是明智的。微软拥有OpenAI生产的所有知识产权,因此它能从这家初创公司取得进展的好处;与此同时,OpenAI又足够独立,不会被微软的官僚主义所束缚。
另一个对Bard不利的因素是,聊天领域可能存在着赢者通吃的动态。
为了彻底否定我之前提出的一个观点,聊天机器人并不是人类。因此,我们可能会像对待其他软件产品一样对待它们:我们只会记住那些我们每天使用多次的机器人。在这样一个世界里,使用情况可能会趋向于大多数人使用最好的可用聊天机器人——而目前最好的是ChatGPT。
这种动态为ChatGPT创造了一个不断增强的地位:它拥有的用户越多,它就能够利用更多数据来改进产品,从而吸引更多用户。在历史聊天记录方面也存在次级的正向反馈循环。一个例子:ChatGPT可能会整合一个可以回忆你过去对它说过的事情的记忆——提高结果质量并防止人们切换。
这样,聊天机器人领域可能会看起来很像搜索。会有一个主导者(就像Google)。还会有许多小的聊天机器人整合到人们已经使用的现有体验中(就像个别网站上的搜索框)。但后者的机会将微不足道,与前者相比。
那么哪一个是正确的呢?
聊天机器人的邓巴数很高 - 对于目标聊天机器人来说,它是1。我觉得目标聊天机器人的邓巴数是1。换句话说,我们很可能会发现自己生活在一个由一个主导目标聊天机器人组成的世界。我认为那个会是ChatGPT。它目前是最好的,拥有一个强大的数据推动系统。OpenAI拥有最高密度的人才,而且随着Sam Altman的回归,它变得更加专注和有活力。
但我认为用户会有需求,希望在他们访问的单一目的地内与许多聊天机器人进行交互。我认为ChatGPT将会不断改进定制的GPT,直到你可能在某一天或某种情况下与不同的聊天机器人进行交互。我们的大脑就是为此而设计的 - 记住,我们可以同时保持多达150个社交关系 - 所以可能性非常丰富。
你已经可以在Poe等聊天平台上看到这一点的开端,它允许你在同一个界面内与GPT-4、Claude以及用户定制版本的聊天机器人进行交互。Character.AI也提出了类似的概念,允许用户与具有不同个性和记忆的聊天机器人进行交互。
ChatGPT可能在某个时候会变得像Slack一样,但是会有一个人和许多不同的机器人。与现在一次只能与一个机器人聊天不同,你可能会有一个单一的频道,可以同时与许多不同的机器人进行交谈 - 在适当时提供他们的观点和专业知识。
聊天机器人的邓巴数很高;目标聊天机器人的邓巴数是1。游戏开始。