Gemini Live 是 Google 针对 ChatGPT 高级语音模式推出的一款解决方案
Gemini Live 是 Google 为对抗 OpenAI 的 ChatGPT 高级语音模式而推出的新功能,允许用户通过智能手机与 Google 的生成型 AI 聊天机器人进行深入的语音对话。该产品利用增强的语音引擎提供更具情感表现力和现实感的多轮对话。虽然目前功能尚不包括多模态输入,但计划在今年晚些时候发布,并且将扩展至多种语言和 iOS 平台。该功能依托于高级 AI 模型 Gemini 1.5 系列,为用户提供更长的上下文窗口,以支持长时间对话。
关键点
- Gemini Live 于 Google 的 "Made by Google 2024" 活动中正式发布。
- 用户可以通过智能手机使用 Gemini 进行深入的语音交流,并能在对话中随时中断和插入问题。
- 该功能支持在后台或手机锁定状态下进行免提对话,并可随时暂停或恢复。
- Gemini Live 采用高级 AI 模型,可利用大上下文窗口进行数据分析。
- 该功能目前仅提供英语支持,但计划年内扩展至更多语言和 iOS 平台。
- Gemini Live 定价为每月 20 美元,包含在 Google One AI 高级计划中。
- 未来更新将包括多模态输入、新图像生成功能以及与 Google 服务更深度的集成。
Gemini Live, Google’s answer to ChatGPT’s Advanced Voice Mode, launches