中国电信 TeleAI 星辰语音大模型升级,支持中英双语及 40 种方言任意混说
北京,2024年 11 月 3 日 – 中国电信人工智能研究院(TeleAI)今日宣布,其研发的“星辰”语音识别大模型再次升级,现已支持中英双语及 40 种方言的任意混说,进一步提升了语音识别技术的应用范围和用户体验。
此次升级是继今年 5 月发布业内首个支持 30 种方言自由混说的“星辰超多方言语音识别大模型”后的又一次重大突破。TeleAI 团队攻克了湛江话、宜宾话、洛阳话、烟台话等多种方言,将支持的方言种类从 30 种提升至 40 种,并引入对英文的识别功能。这意味着,用户现在可以使用多种方言和英语进行语音交互,打破了语言障碍,为跨语言交流和多语言应用场景提供了更强大的支持。
TeleAI 在此次升级中采用了一种全新的训练方法,即“预训练 + 微调”。与传统的需要大量有标注数据的训练方法相比,TeleAI 利用海量无标注数据对预训练语音识别模型进行预训练,再通过少量有标注数据进行微调。这种方法有效地解决了方言语音数据普遍存在无标注数据多而有标注数据少的难题,并大幅降低了模型训练的成本。
TeleAI 还对模型结构和成本优化进行了创新,将人工标注数据的需求量降低了约 50 倍,同时确保模型效果与有监督训练的方言模型水平相当。这不仅提高了模型训练的效率,也为大规模推广方言语音识别技术提供了更经济可行的方案。
“星辰”语音识别大模型的升级,标志着中国电信在语音识别领域取得了新的突破。该模型的应用场景非常广泛,例如:
- 智能客服: 支持多种方言和英语的语音识别,可以为用户提供更便捷、更自然的语音交互体验,提升客服效率。
- 语音助手:可以更准确地识别用户用方言或英语发出的指令,提供更个性化的语音服务。
- 语音转文字: 支持多种方言和英语的语音转文字功能,可以方便用户将语音内容转化为文字,提高工作效率。
- 语音搜索: 支持多种方言和英语的语音搜索功能,可以方便用户用语音进行搜索,获得更精准的搜索结果。
TeleAI 的“星辰”语音识别大模型的升级,不仅为用户带来了更便捷、更智能的语音交互体验,也为中国电信在人工智能领域的发展奠定了坚实的基础。未来,TeleAI将继续深耕语音识别技术,不断提升模型的性能和应用范围,为用户提供更优质的语音服务,推动人工智能技术在各行各业的应用落地。
关于中国电信 TeleAI
中国电信人工智能研究院(TeleAI)是中国电信旗下的专业人工智能研究机构,致力于人工智能基础理论研究、核心技术攻关和产业应用推广。TeleAI 在语音识别、自然语言处理、机器视觉、机器学习等领域拥有领先的技术优势,并已在智慧城市、智慧医疗、智慧金融等多个领域取得了显著成果。
GitHub 开源地址:
https://github.com/Tele-AI/TeleSpeech-ASR
Views: 0