终于来了!OpenAI今日正式开放了GPT-4o的高级语音功能,这一功能让模型能够用中文说“对不起”,并用五种新声音为用户带来更加真实的人机对话体验。这一消息让众多用户激动不已,因为这标志着OpenAI在语音技术上又迈出了重要一步。
谷歌被截胡,OpenAI先行一步
就在谷歌刚刚宣布升级两款模型Gemini-1.5-Pro-002和Gemini-1.5-Flash-002的几小时后,OpenAI迅速推出了GPT-4o的高级语音功能。这一举动让OpenAI再次在人工智能领域抢占了先机,也让用户们感叹“谷歌又被OpenAI截胡了”。
高级语音功能全面升级
此次推出的高级语音功能不仅支持中文,还能用50多种语言说“抱歉我迟到了”。此外,它还新增了自定义指令、记忆功能,以及五种新声音和改进的口音。这些升级使得对话更加流畅自然,仿佛在和真人交流。
Plus和Team用户优先体验
OpenAI将逐步向用户推出访问权限,所有Plus用户将在秋末之前获得访问权限。而Team用户则拥有更多的使用次数,每月需支付30美元。相比之下,免费用户暂时无法体验这一高级功能。
多样化的声音选择
为了满足不同用户的需求,OpenAI推出了五种新声音,分别被命名为Arbor、Maple、Sol、Spruce和Vale。这些声音由来自世界各地的专业配音演员制作,声音温暖、平易近人、具有丰富的质感和语调。
欧盟地区暂时无法使用
需要注意的是,新功能尚未在欧盟、英国、瑞士、冰岛、挪威或列支敦士登推出。因此,这些地区的用户暂时无法体验GPT-4o的高级语音功能。
用户反馈与改进
在开放高级语音功能后,OpenAI还收到了一些用户的反馈。例如,GPT-4o的演示视频中曾出现与电影《Her》中饰演AI恋人的斯嘉丽·约翰逊声音相似的声音,这一情况在新版中得到了改进。现在,最新推出的五种新声音将为用户提供更加多样化的选择。
未来展望
除了高级语音功能,OpenAI还发布了多语言大规模多任务语言理解(MMMLU)数据集,涵盖了多种语言和不同类别的主题,这将进一步提升模型在多语言环境中的理解和生成能力。
总之,GPT-4o的高级语音功能的开放标志着OpenAI在人机交互技术上的又一突破。随着技术的不断进步,我们有理由相信,未来的人工智能将更加贴近人类的生活,带来更多的便利与惊喜。
Views: 0