Gemini Live 首次亮相:比与 Siri 对话更好,但比我想象的要差
Gemini Live是Google在其活动中推出的一项新功能,它能够通过最新的大语言模型进行半自然的语音对话。与ChatGPT的高级语音模式相似,但Google在推出最终功能方面领先。测试表明,Gemini Live的响应速度很快,其语音选择多样且自然,尽管仍存在瑕疵,如语音对话中断时的响应不完美。总的来说,对于希望免提使用手机的人来说,Gemini Live是一个不错的选择,且有可能进一步发展到具备实时视频理解的功能。
关键点
- Google推出Gemini Live,令用户可以与AI聊天机器人进行语音对话。
- 在语音响应速度和自然度上,Gemini Live优于Siri和Alexa。
- 用户可以从10种声音中选择,而OpenAI仅提供3种。
- Gemini Live在复杂搜索任务中的表现优于某些其他语音助手。
- 曾出现信息错误,如虚构的邻近公园。
- 偶尔在语音被打断时,Gemini Live未能很好地处理对话。
- 不支持模拟或模仿用户之外的语音以避免版权纠纷。
Gemini Live first look: Better than talking to Siri, but worse than I’d like