西湖心辰发布端到端语音大模型Lingo,媲美GPT-4o
杭州,2024年8月24日 – 国内领先的人工智能公司西湖心辰今日宣布推出其首个端到端语音大模型Lingo,并于当日开启内测预约。据悉,Lingo在技术上具备实时打断、实时指令控制、超级拟人、能说会唱等能力,拥有比GPT-4o更出色的中文语音效果,预计将在9月5日的外滩大会上正式发布并开放内测。
Lingo的出现标志着国内语音大模型技术取得重大突破。与传统的语音技术相比,Lingo采用了端到端的设计,意味着它能从输入的语音信号直接生成输出的语音或文本,无需经过多个独立的处理阶段,简化了系统架构,提高了效率。此外,Lingo还基于深度学习算法,特别是神经网络,来处理和分析语音数据,算法可以自动学习和提取语音信号中的特征,用于语音识别、语音合成和语言理解。
Lingo的主要功能包括:
- 原生的语音理解: Lingo不仅能识别语音中的文字信息,还能精确捕捉其他重要特征,如情感、语气、音调,甚至环境音,帮助模型更全面地理解语音内容,从而提供更加自然和生动的交互体验。
- 多种语音风格表达: Lingo可以根据上下文和用户指令,自适应调整语音的速度、高低、噪声强度,并能生成对话、歌唱、相声等多种风格的语音响应,有效提升了模型在不同应用场景下的灵活性和适应性。
- 语音模态超级压缩: 采用具有数百倍压缩率的语音编解码器,能将语音压缩至极短的长度,在显著降低计算和存储成本的同时帮助模型生成高质量语音内容。
- 实时交互能力: Lingo能实时响应用户指令,包括随时打断和实时控制,提供流畅的对话体验。
- 高自然流畅度: 模型在实时交互时,可以完全模拟人类的行为、情感和反应模式,提供高度自然流畅的对话体验。
- 情绪价值能力: Lingo赋予了AI “倾听”、”引导”与”共情”等情绪价值能力,使AI在满足高智商的基础上,能与人类开展高情商的对话交流。
Lingo的应用场景非常广泛,包括:
- 智能家居控制: Lingo可以集成到智能家居设备中,通过语音指令控制家中的智能设备,如灯光、温度等。
- 客户服务: 在客户服务领域,Lingo可以作为智能客服助手,提供7*24的咨询服务,处理客户查询,收集反馈,并提供个性化服务。
- 教育辅助: Lingo可作为教育辅助工具,帮助学生学习语言、解答问题,互动式学习提高学生的参与度和兴趣。
- 个人助理: 作为虚拟个人助理,Lingo可以帮助用户设置提醒、管理日程、搜索信息、播放音乐或播客等。
- 医疗健康: 在医疗领域,Lingo可以帮助患者进行健康咨询,提醒用药时间,甚至在紧急情况下提供快速响应。
西湖心辰创始人兼CEO蓝振忠表示:“Lingo的推出是西湖心辰在语音大模型领域取得的重大突破,标志着我们向打造更智能、更人性化的AI产品迈出了重要一步。我们相信,Lingo将为用户带来更加便捷、高效、个性化的语音交互体验,并推动人工智能技术在各领域的应用发展。”
Lingo的内测预约现已开启,感兴趣的用户可以访问lingo.xinchenai.com进行预约。
Views: 0