语音识别新突破：低秩适配技术革新说话人个性化

作者智能小编

9 月 8, 2024 #Samsung, #新闻

上海宝山炮台湿地公园的蓝天白云

[新闻稿标题]

Samsung Introduces Weight-Decomposed Low-Rank Adaptation for Enhanced Speaker Personalization in ASR

[城市，日期] – 在全球领先的语音识别、语音合成、说话人识别和语音语言处理技术会议Interspeech 2024系列活动中，三星展示了其最新的研究成果——使用权重分解低秩自适应技术进行说话人个性化自动语音识别（ASR）。

背景介绍

自动语音识别技术在语音助手系统中的应用越来越广泛，而个性化语音识别技术更是被视为该领域的“圣杯”。在处理有限说话人数据的情况下，如何优化模型成为关键。三星的研究团队提出了使用低秩自适应（LoRA）和权重分解低秩自适应（DoRA）技术，以提升说话人个性化ASR系统的性能。

研究方法

三星的研究团队对现有的级联卷积神经网络（Conformer）转码器模型进行了优化，通过添加少量的说话人特定权重并相应地进行微调，实现了说话人个性化。实验结果表明，在有限数据情况下，该方法的平均相对词错误率降低了20%，证明了其在实际应用中的有效性。

研究成果

该研究采用了两种低秩自适应变体——LoRA和DoRA，对ASR系统中的说话人个性化进行了探索。其中，LoRA方法通过向权重矩阵中添加一小部分参数来实现，而DoRA则通过权重分解技术优化权重矩阵。

实验结果

实验结果显示，使用LoRA和DoRA技术进行说话人个性化后，在有限数据情况下，ASR系统的性能得到了显著提升。这表明该技术有望为ASR系统的实际应用提供更精确的个性化体验。

总结

三星的研究成果为ASR技术的进一步发展提供了新的思路和方法。随着人工智能技术的不断进步，未来语音识别技术将在更多场景中得到应用，为用户带来更加便捷和个性化的体验。

[记者联系方式]

这篇新闻稿以简洁明了的语言概述了三星在Interspeech 2024会议上展示的研究成果，并突出了其在ASR领域的创新性贡献。

>>> Read more <<<

智能新闻

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

语音识别新突破：低秩适配技术革新说话人个性化

作者智能小编

[新闻稿标题]

背景介绍

研究方法

研究成果

实验结果

总结

相关文章

腾讯AI“元宝”杀入微信，13亿用户社交版图重塑？

2025人工智能：颠覆与新生

北大团队突破！单目长视频实时重建高质量3D点云

发表回复取消回复

为您推荐

腾讯AI“元宝”杀入微信，13亿用户社交版图重塑？

2025人工智能：颠覆与新生

北大团队突破！单目长视频实时重建高质量3D点云

Powering Real-Time Engagement Build with Live APIs

作者智能小编

[新闻稿标题]

背景介绍

研究方法

研究成果

实验结果

总结

相关文章

发表回复 取消回复

为您推荐

发表回复取消回复