对2024年人工智能的五大预测
对人工智能领域可能又一个辉煌年的期望
也许在科技世界里,没有比年末预测更频繁的传统了(或者从你的角度来看,更烦人的)。随着人工智能领域的快速发展,很难预测未来一年甚至一个月会发生什么,所以预测有点像电影《战争游戏》里说的,“唯一的赢棋之法就是不下棋”。但就像任何一位只有“坚定观点但保持怀疑态度”的沙发专家一样,加上一点点直觉,玩这个游戏是有趣的,因此我们也来预测一下我们对2024年人工智能世界的期望。
我们很期待在十二个月后回头看看,我们是否超过了今年的3/5分数!

1)开源模型超越了闭源模型
开源模型今年以一种显著的方式走入了聚光灯下,但我们预计到2024年,开源模型将会飞速发展。在2023年,像Llama-2、Mistral AI、Falcon 180B、EleutherAI等模型的引入标志着它们在公共领域的重要进展,引起了相当大的关注。这些开源模型已经达到了与闭源模型相媲美,甚至更优越的性能水平。它们成功的一个关键原因是在研究和技术进步方面的大量投资。值得注意的是,像Meta(FAIR)这样的主要科技实体拥有庞大的研究部门,支持着数亿美元的资金,致力于打造高端的开源模型。其他一些知名研究机构也获得了大量资金,专门致力于推动这些模型的发展,实现民主化进程。
我们相信大型开源模型将通过两个主要渠道不断扩散:
- 1、小型、以研究为导向的组织和初创公司:(例如,EleutherAI、Mistral)
- 2、大型科技公司:(例如,Meta(Llama-2)、Salesforce(XGen-7B))
我们预测在2024年会有更多开源模型发布,我们特别关注大型科技公司成为主要贡献者之一。一些例子可能包括像特斯拉、优步和Lyft这样的公司(它们历来是开源项目的重要贡献者),甚至还有Snowflake。如果其中一些模型发展成公司并获得大额资金支持,我们也不会感到意外。
开源模型有许多好处,包括增强的数据和隐私、成本节约和减少对供应商的依赖、更快的迭代周期以及定制化。与此同时,它们也需要比利用OpenAI API更多的技术理解。请参阅我们关于开放模型与封闭模型的文章。

2)苹果苏醒(在人工智能领域)
几乎所有的“大科技”公司今年都在人工智能领域迅速发展。微软通过与 OpenAI 的合作继续领跑,将人工智能整合到从 GitHub Copilot(现已覆盖超过 100 万开发者)到 Azure AI Studio 的所有产品中。亚马逊最近在其旗舰 re:Invent 大会上宣布了几款全新的以人工智能为先的产品,包括 Amazon Q 和 Titan 文本到图像模型。就在上周,谷歌发布了其“最大、最有能力的人工智能模型” Gemini 的演示视频(尽管该演示在模型的真正能力上引起了相当大的争议)。
有一个名字在这份名单上明显缺失:苹果。
尽管苹果长期以来一直在其产品中融入机器学习(比如 Siri 和 FaceID),但在过去一年的生成式人工智能爆发中,苹果显然措手不及,尚未发布任何能与其大科技同行相媲美的耀眼声明。然而,我们相信 2024 年将是这家全球市值最高的公司在人工智能领域“苏醒”的一年。
去年九月,有报道称苹果正在每天投入“数百万美元”用于培训一款名为 Ajax GPT 的新 LLM。尽管该模型是为内部使用而创建的,但也许明年我们会看到苹果将 Ajax(或相关模型)更多地公开,或者在其应用程序(如 XCode、Apple Music)和设备(如 Mac、Vision Pro)中整合生成式人工智能能力。尽管这更多地属于机器学习而非人工智能,但就在上周,苹果发布了 MLX - 一款“专为 Apple silicon 设计的高效机器学习框架”。
只需看一眼苹果招聘网站上 300 多个与人工智能相关的职位,就能感受到他们在这一领域的雄心壮志 🙂

3)多模态成为常态
今年,OpenAI宣布了许多新的多模态功能,包括语音转文字、图像转文字和多语言翻译。正如他们所描述的,ChatGPT现在可以“看、听、说”。在2023年,我们刚开始看到这些模态的力量和能力,但在2024年,我们相信大多数模型将提供多模态功能。
在2024年,我们可能会见证一个世界,个人可以无缝地将他们在时尚达人身上发现的时髦夹克的图片直接上传到Nordstrom购物应用程序,立即生成5-10个类似的可供购买的选项。或者,想象一下在West Elm浏览,觉得一张沙发价格太高;你可以求助于ChatGPT,请求帮助找到5个更实惠的替代品。或者,在日本旅行时,你可能会体验到实时翻译服务,促进从英语-日语-英语的即时沟通,消除语言障碍和延迟问题。
尽管如此,我们承认在弥合现实世界人机交互与实现人工智能的旅程中仍存在挑战。因此,我们对今年的预测围绕着加强将收集的数据转化为LLM可理解格式的关注。我们预计会出现专门设计的增强工具,用于将数据转换为更普遍可理解的格式,以及增强LLM解释各种数据类型的能力的创新。除了传统的模态,如语音、文本、视频和语言,我们预计传感器数据等其他模态的相关性会增加,拓宽信息处理和理解的范围。

4)今年,我们看到许多开源项目像野火一样蓬勃发展。像BabyAGI(在GitHub上有18.3K星)这样的项目是AI驱动的任务代理系统的一个典型例子。这些代理系统(理论上)是完全自主的任务管理系统,可以通过利用人工智能来创建、跟踪和优先处理所有你的项目。每个系统都是专门为你个性化定制的。
2023年,代理的概念开始引起关注,但其广泛应用仍然相对新生。然而,我们相信在2024年,这些应用程序将大量涌现,覆盖消费者和企业领域。
想象一下这种情景:设想一个世界,每个人都拥有自己的个人代理或为不同目的量身定制的多个代理。例如,你可能会有一个专门用于专业任务的“执行助理”代理,以及一个“旅行代理”、“商业教练代理”甚至是“体育教练代理”,每个代理都服务于你生活的不同方面。这些多样化的代理不仅会与个人互动,还会与企业互动,而这些企业也会有他们自己的代理版本。各种代理和企业之间的互动将旨在提供高度个性化的体验,满足每个人的特定需求和偏好。
像Gather、MultiOn和Stochastic这样的公司开始提供一些代理之间的体验 - 2024年会有更多吗?我们认为会有!

5) ROI问题变得真实
在ChatGPT一年前出现后不久,我们就开始听到来自大公司和小公司的CEO们如何最好地将生成式人工智能(GenAI)纳入他们的组织中。这次对话围绕着人工智能如何通过新工具赋予他们的员工力量,以及如何通过人工智能增强能力来提升他们自己的产品。我们很快看到了许多报告详细说明了在GenAI上花费的数十亿美元以及要创造的数万亿美元的市场规模。
正如我们的合作伙伴Matt McIlwain最近所写的,去年春天问“我们的GenAI战略是什么”的那些CEO们,今年夏天将会问一个非常不同的问题——“我们的GenAI支出的投资回报率是多少?”
我们为什么认为这种转变将在2024年发生?我们的感觉是,在2023年,高管和管理团队很乐意在像Jasper、ChatGPT Enterprise等新人工智能产品上花费试验性的资金。现在几乎每个主要企业应用程序都在注入人工智能(Salesforce、ServiceNow、Microsoft等),C级高管们将不得不确定他们的预算应该分配到哪里以实现最大的回报。而且投资回报率不仅仅是以美元来衡量,还包括时间和资源的分配。
虽然我们确实不希望人工智能的支出减少,但我们预计会发生重新分配,首席财务官将更加关注他们在人工智能上如何花最少的钱获得最大的回报。

作为我们接近也许是最激动人心的人工智能年度结束时,毫无疑问,创新的步伐正在加速。虽然我们赞同老约基·贝拉的格言“很难预测,尤其是关于未来”,但有一件事是可以肯定的,那就是2024年将会带来一些出乎意料的惊喜。我们期待着另一个激动人心的一年,并且期待着在十二个月后回顾我们的预测的准确性!