财联社报道

在人工智能领域再掀波澜,OpenAI于周二(9月24日)宣布,正式面向所有付费用户推出ChatGPT的类人高级人工智能(AI)语音助手功能——“高级语音模式”(Advanced Voice Mode,以下简称AVM)。

AVM功能逐步开放

根据OpenAI的官方消息,所有付费订阅ChatGPT Plus和Team计划的用户,都将可以使用新的AVM功能。不过,该功能的推出将采取逐步开放的方式,预计在未来几天内完成。AVM功能首先将在美国市场上线,下周则将向OpenAI Edu 和Enterprise 计划的订阅者开放。

功能升级与优化

AVM的推出,意味着ChatGPT语音助手功能的重大升级。新功能不仅提高了部分外语的对话速度、流畅度,还改进口音,使得语音助手在交流中更加自然、亲切。

此外,AVM新增了两大功能:一是为语音助手存储“自定义指令”,二是记住用户希望语音助手表现何种行为的“记忆”功能。这两项功能使得语音模式更加个性化,用户可以根据自己的偏好来调整语音助手的响应。

声音风格多样化

在声音风格方面,OpenAI此次推出了五种新声音:Arbor、Maple、Sol、Spruce 和 Vale。加上之前老版本的四种声音Breeze、Juniper、Cove和Ember,现在用户可以选择的声音达到了九种。值得一提的是,之前被指山寨“寡姐”(女演员斯嘉丽·约翰逊)的声音Sky已经被撤下。

应用场景丰富

AVM的推出,为ChatGPT的Plus版个人用户和小型企业团队用户带来了全新的使用体验。用户可以通过“说话”的方式,而不是输入提示来使用聊天机器人。当用户在应用程序上进入语音模式时,他们会通过一个弹出窗口知道已经进入了高级语音助手。

AVM功能的强大之处还体现在它可以用超过50种语言说“对不起,我迟到了”。例如,根据OpenAI在社交平台X上发布的一段视频,用户要求语音助手用中文普通话向奶奶道歉,AVM流畅地完成了这一任务。

限制与展望

然而,需要注意的是,这些更新只适用于OpenAI的AI模型GPT-4o,不适用于最近发布的预览模型o1。此外,AVM功能在5月份首次展示时,包含了计算机视觉功能,但此次发布并未包含这一功能。

尽管如此,AVM功能的推出无疑为人工智能领域带来了新的突破,也为用户提供了更加丰富多样的交流体验。随着技术的不断进步,未来AVM功能有望进一步优化,为用户带来更多惊喜。


>>> Read more <<<

Views: 24

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注