微软AI语音服务升级：文本变视频，虚拟人开口说话！

作者智能小编

9 月 9, 2024 #每日AI快讯, #虚拟人

上海枫泾古镇一角_20240824

引言

2024年8月23日，微软宣布全面推出其Azure AI语音服务中的Text to Speech Avatar功能。这一创新功能将文本转换为自然的人类说话视频，为开发者提供了前所未有的个性化虚拟人形象创建能力。

功能概述

微软Azure AI语音服务允许开发者构建多语言生成式AI语音应用。Text to Speech Avatar功能是Azure AI语音服务最新推出的功能，可以将简单的文本转换为具有自然声音的人类说话视频。以下是Text to Speech Avatar的主要功能：

自然声音的视频生成：利用Azure AI文本转语音技术，生成的视频具有自然的声音，让用户仿佛在与真实人类对话。
多样化的虚拟人形象：提供不同的人物预设形象，满足不同场景下的需求。
批量合成API：支持异步或实时合成文本到语音人像视频，提高开发效率。
无需编码即可创建视频内容：在Speech Studio中提供内容创建工具，简化视频制作流程。
实时人像对话：通过Speech Studio中的实时聊天头像工具，实现与虚拟人的实时对话。

技术优势

Text to Speech Avatar功能具有以下技术优势：

高分辨率输出：视频分辨率为1920 x 1080，每秒25帧，确保视频画面清晰流畅。
多语言支持：支持多种语言，满足全球开发者的需求。

应用场景

Text to Speech Avatar功能的应用场景广泛，包括但不限于：

虚拟客服：为用户提供24小时在线客服，提高客户满意度。
教育培训：制作个性化的教学视频，提高学习效果。
游戏娱乐：打造更具互动性的游戏体验。

服务推广

目前，文本转视频服务已在东南亚、北欧、西欧、瑞典中部、美国中南部和美国西部地区推出。微软将继续扩大服务范围，让更多开发者受益。

总结

微软Azure AI语音服务的Text to Speech Avatar功能为开发者提供了强大的个性化虚拟人形象创建能力。这一创新功能将为各行各业带来更多可能，推动AI技术的发展和应用。

>>> Read more <<<

智能新闻

一	二	三	四	五	六	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30

微软AI语音服务升级：文本变视频，虚拟人开口说话！

作者智能小编

引言

功能概述

技术优势

应用场景

服务推广

总结

相关文章

China’sHousing Stock Faces Shocking Aging Crisis

联想诉中兴：英国对簿公堂，背后有何隐情？

TheWomen Who Shaped Musk and Trump’s Souls

发表回复取消回复

为您推荐

China’sHousing Stock Faces Shocking Aging Crisis

联想诉中兴：英国对簿公堂，背后有何隐情？

TheWomen Who Shaped Musk and Trump’s Souls

吸引眼球的新闻标题：马斯克与特朗普，谁更懂女人？

作者智能小编

引言

功能概述

技术优势

应用场景

服务推广

总结

相关文章

发表回复 取消回复

为您推荐

发表回复取消回复