返回首页
2023.12.17 23:02 约 7 分钟 AI深度学习

2024 年的 GenAI——一年又一个十年?

我们对2024年期待什么?市场的成熟和人工智能的实验性应用。

一个著名的俏皮话是,人们总是高估一年内会发生的变化,低估十年内会发生的变化。过去一年是这个规则的一个例外,这得益于ChatGPT的推出和应用AI技术的快速接受。2022年12月,我问一位知名的管理顾问,他的客户有多经常询问GenAI的事情,他说几乎从来没有提出过这个问题。仅仅六个月后,每位CEO都在问他们的领导团队:我们的GenAI战略是什么?

在Madrona,我们对这种转变的第一排座位证实了我们对2023年将如何发展的几个预期。年初,我们相信模型的广度(特别是开源模型)、AI“中间件”的崛起,以及现有SAAS软件公司迅速利用GenAI大幅增强其产品的机会。这些预测已经在商业上取得了成效。当时,一些主要的创新,包括低秩适应(LoRA)、检索增强生成(RAG)和提示工程,从商业角度来看几乎没有被理解。但是,到了我们2023年10月的智能应用峰会,所有这些话题都被广泛讨论了。

随着我们接近2024年,有三大宏观趋势很可能会继续加速应用AI领域的变化步伐。它们是:

  1. 从模型到模型“鸡尾酒”和应用编排
  2. 从原型到生产和数据的关键作用
  3. 从“让我们试试”到投资回报率

模型用于模拟鸡尾酒

我们在与亚马逊最近的AWS re:Invent峰会和微软的Ignite会议配合进行了关于模型鸡尾酒的重点讨论。此外,本·汤普森在Stratechery上有一篇最近相关的帖子。Bedrock是亚马逊的AI模型即服务,位于硬件/基础设施之上和基础模型之下,帮助客户定制和编排这些模型,以便在应用程序的上下文中部署。正如AWS首席执行官亚当·塞利普斯基在他的主题演讲中所概述的那样,Bedrock是他们生成式AI堆栈中底层和顶层之间的核心链接。

微软选择在秋季的Ignite大会上专注于他们的应用层“联合驾驶员”。但首席执行官萨蒂亚·纳德拉(Satya Nadella)预览了一个名为“模型即服务”的产品,其功能类似于AWS Bedrock。除了这些大型云服务提供商,我们预计英伟达(Nvidia)和HuggingFace、OctoML等新兴公司将在协调人工智能堆栈层面发挥日益重要的战略作用,以推动智能应用的发展。

除了更广泛的模型即服务平台,RAG、LoRA、提示工程和其他形式的模型定制和个性化正变得司空见惯。在未来一年中,这些工具将有许多变种。应用程序构建者通过在OpenAI领先但昂贵的模型上进行提示原型设计,然后在成本较低(通常是开源)的模型上进行微调和集成。我们还看到提示工程正在演变为开发者平台,正如Vertex最近的一篇文章中所提到的那样:“开发者将以声明式方式编程,类似编译器的功能将把这些任务、SLA和I/O保证转化为优化的提示。”在这些进展持续的同时,产品,包括Github Co-pilot和AWS CodeWhisperer,将应用更加量身定制的基础模型和工作流程,以提高软件开发的速度和效率。这些趋势将共同推动基于人工智能的创新,并将催生新的应用编排框架。

从原型到生产
对许多公司来说,2023年是GenAI早期学习和原型设计的一年。公司经常发现他们的数据尚未准备好用于模型训练、微调或在向量数据库(用于RAG)中使用。像unstructured.io这样的公司出现,帮助处理访问、准备和成本效益地使用数据的数据管道。这一进展让您能够摄取数据,但开发者们经常发现这些模型在生产环境中(推断)扩展成本过高或过于不可预测。

公司和客户越来越理解数据和元数据的力量和价值,用于训练或微调模型。互联网的直接内容和“数据排放”主要用于训练基础模型,如OpenAI的GPT4和Anthropic的Claude。但还需要更多的数据和元数据,才能将通用模型转化为适合特定领域、公司甚至特定客户需求的定制模型。到2024年,可能会出现“数据层次结构”,其中广泛的互联网数据将大多是可访问的,领域特定数据将直接或间接实现货币化,并且公司/客户数据将被用于定制和个性化的用途。

2024年将是生命科学、金融服务和软件开发等领域特定模型的重要一年。这些模型将使公司能够从原型转向生产。无论是预测蛋白质结构、定价金融证券还是编写定制代码,这些模型将根据特定领域的数据进行开发和区分。在这里更难预测的方面是不同层面的数据将变得多么易获取。特定领域的数据和元数据大多被视为专有,公司需要从长远的角度来考虑,以便在追求其最终战略时使一定量的领域数据广泛可获取。正如在生命科学领域的蛋白质折叠预测方面所做的那样,研究和开放数据运动将提供一定水平的开放数据。然而,与智能应用相关的差异化数据、元数据和模型权重的价值将变得越来越重要。随着使用差异化数据和运行引人注目的领域模型的商业价值增加,数据权利的经济和监管影响将上升。毕竟,早期的赢家应该能够打造培训数据、模型、参与度和使用/反馈数据的AI飞轮。

“让我们试试”回报率
随着公司从原型转向生产,他们将意识到应用AI的最大成本是推理,而不是训练。训练可能受人才和数据限制,但推理将受到美元和计算资源(芯片、功率、内存)的限制。去年春天问过“我们的GenAI战略是什么?”的同样的CEO们,将在即将到来的夏天问一个不同的问题-我们的GenAI投资的回报率是多少?他们将让首席财务官及其团队跟进以验证答案!

我们相信,我们今年为制定GenAI策略所概述的三管齐下的方法,如果深思熟虑地执行,将继续为公司服务良好。三个关键是询问客户在哪些地方看到GenAI的机会,与成熟的技术公司合作,迅速将能力带到市场,并与初创公司和其他人在前沿领域特定用例上进行实验。

像软件开发人员生产力工具(Microsoft Co-pilot、Amazon Q)和客户服务/成功助手这样的优先使用案例已经在提供回报率。其他关注领域包括聊天机器人和AI助手,帮助客户服务和客户成功。在即将到来的一年里,各种形式的提高生产力和增加员工工作满意度/保留率将是一个强大的回报率来源(尽管最初可能难以衡量)。包括Microsoft365 Co-Pilot在内的广泛提供和像read.ai这样的专注提供正在帮助提高个人和团队的效率。我们预计智能应用提供商将借助像Statsig这样的工具来衡量genAI提供的参与度和盈利影响。到2024年底,我们预计一系列类似于云消费腾飞时出现的GenAI成本评估工具将涌现。

短期内,我们相信现有软件公司将因为AI增强的定价溢价而获得大量的顶线增长。像微软、Salesforce、Adobe等公司已经宣布了他们的这类增强的“标价”。我们看到早期采用客户与这些提供的互动和商业价值。但是,究竟有多少价值会被软件公司获取,提供商在销售这些能力方面会有多成功,这些还有待确定。在Gen-Native初创公司中也将出现一些突破性公司。最有趣的问题将围绕成本效益的分发和建立长期“壕沟”的能力展开。

去年对GenAI来说是一夜成名,但对于利用先前的人工智能相关基础构件来说,却是一个变革性的一年。这一年特别之处在于ChatGPT引领的应用型人工智能迎来了最终用户的转折点。潜在的人工智能模型融合了多样的数据形式和类型,人类的提示作为直观的输入,输出变得生成性而非仅仅是预测性。但是,我们只是刚刚开始。我们相信,就像1994年至1996年的互联网时期一样,2023年至2025年将被认为是世界上生成式和应用型人工智能最具变革性的时期之一。

2024年应用型人工智能将迎来巨大的机遇。模型将被组合、定制并编排成智能应用程序。开放模型、数据和评估将变得更加突出。GenAI在边缘的早期迹象将会出现。模型和应用的治理、监管、安全和透明度的重要性将会扩大。生成式人工智能的创造性和潜在的危险用途将以不可预测的方式影响美国总统选举年。尽管预计会面临挑战,我们仍然谨慎乐观地认为,2024年将会看到许多智能应用成功地、有利可图地部署在各种用例、功能领域和领域之中!

 

 

了解 RecodeX 的更多信息

立即订阅以继续阅读并访问完整档案。

继续阅读