西湖心辰Lingo模型横空出世，语音大模型挑战GPT-4o

西湖心辰近日推出了一款名为Lingo的端到端语音大模型，该模型在中文语音效果上媲美GPT-4o，引起了业界广泛关注。Lingo语音模型已于2024年8月24日开启内测预约，预计将在9月5日的外滩大会上正式发布并开放内测。

技术突破，实现高情商对话

Lingo是国内首个端到端语音大模型，具备实时打断、实时指令控制、超级拟人、能说会唱等能力。该模型不仅提高了人机对话的自然流畅度，还赋予了AI“倾听”、”引导”与”共情”等情绪价值能力，使AI在满足高智商的基础上，能与人类进行高情商的对话交流。

Lingo能识别语音中的文字信息，同时精确捕捉情感、语气、音调，甚至环境音，从而提供更加自然和生动的交互体验。

Lingo可根据上下文和用户指令，自适应调整语音的速度、高低、噪声强度，并能生成对话、歌唱、相声等多种风格的语音响应。

采用具有数百倍压缩率的语音编解码器，将语音压缩至极短的长度，降低计算和存储成本，同时生成高质量语音内容。

Lingo能实时响应用户指令，包括随时打断和实时控制，提供流畅的对话体验。

模型在实时交互时，可以完全模拟人类的行为、情感和反应模式，提供高度自然流畅的对话体验。

Lingo赋予了AI“倾听”、”引导”与”共情”等情绪价值能力，使AI在满足高智商的基础上，能与人类开展高情商的对话交流。

Lingo采用了端到端的设计，从输入的语音信号直接生成输出的语音或文本，简化了系统架构，提高了效率。

Lingo基于深度学习算法，特别是神经网络，处理和分析语音数据，自动学习和提取语音信号中的特征。

Lingo集成了先进的自然语言处理技术，理解和处理自然语言的复杂性，包括语法、语义和上下文。

模型能识别语音中的情感和语调，深入分析音频信号，捕捉说话人的情感状态和意图。

Lingo可广泛应用于智能家居控制、客户服务、教育辅助、个人助理、医疗健康等领域，为用户提供便捷、高效、人性化的服务。

随着人工智能技术的不断发展，Lingo的推出标志着我国在端到端语音大模型领域取得了重要突破。未来，Lingo有望在各个领域发挥重要作用，助力人工智能产业发展。