上海宝山炮台湿地公园的蓝天白云上海宝山炮台湿地公园的蓝天白云

[新闻稿标题]

Samsung Introduces Weight-Decomposed Low-Rank Adaptation for Enhanced Speaker Personalization in ASR

[城市,日期] – 在全球领先的语音识别、语音合成、说话人识别和语音语言处理技术会议Interspeech 2024系列活动中,三星展示了其最新的研究成果——使用权重分解低秩自适应技术进行说话人个性化自动语音识别(ASR)。

背景介绍

自动语音识别技术在语音助手系统中的应用越来越广泛,而个性化语音识别技术更是被视为该领域的“圣杯”。在处理有限说话人数据的情况下,如何优化模型成为关键。三星的研究团队提出了使用低秩自适应(LoRA)和权重分解低秩自适应(DoRA)技术,以提升说话人个性化ASR系统的性能。

研究方法

三星的研究团队对现有的级联卷积神经网络(Conformer)转码器模型进行了优化,通过添加少量的说话人特定权重并相应地进行微调,实现了说话人个性化。实验结果表明,在有限数据情况下,该方法的平均相对词错误率降低了20%,证明了其在实际应用中的有效性。

研究成果

该研究采用了两种低秩自适应变体——LoRA和DoRA,对ASR系统中的说话人个性化进行了探索。其中,LoRA方法通过向权重矩阵中添加一小部分参数来实现,而DoRA则通过权重分解技术优化权重矩阵。

实验结果

实验结果显示,使用LoRA和DoRA技术进行说话人个性化后,在有限数据情况下,ASR系统的性能得到了显著提升。这表明该技术有望为ASR系统的实际应用提供更精确的个性化体验。

总结

三星的研究成果为ASR技术的进一步发展提供了新的思路和方法。随着人工智能技术的不断进步,未来语音识别技术将在更多场景中得到应用,为用户带来更加便捷和个性化的体验。

[记者联系方式]


这篇新闻稿以简洁明了的语言概述了三星在Interspeech 2024会议上展示的研究成果,并突出了其在ASR领域的创新性贡献。


>>> Read more <<<

Views: 0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注