语音 – 既智新闻

智能新闻

语音合成新突破：F5R-TTS零样本克隆性能飙升

2025年4月21日

摘要：腾讯PCG社交线研究团队近日发布了一项突破性的语音合成技术——F5R-TTS。该系统首次成功将群体相对策略优化（GRPO…

智能新闻

Oliva：语音RAG助手，实时搜索向量数据库

2025年4月5日

摘要：在人工智能技术日新月异的今天，语音交互作为一种自然、高效的人机交互方式，正逐渐渗透到各个领域。近日，一款名为Oliva的…

智能新闻

Oliva：开源语音RAG，实时搜索向量库

2025年4月5日

“`markdown Oliva：开源语音RAG助手，实时语音搜索向量数据库，赋能企业与个人知识管理新纪元摘要： …

智能新闻

语音交互：AI应用新王牌，巨头B2C掉队？

2025年4月3日

摘要：风险投资巨头 Andreessen Horowitz (a16z) 的合伙人近日指出，语音交互将成为人工智能 (AI) …

智能新闻

港中文深圳开源Soundwave语音大模型

2025年4月3日

深圳，中国 – 近日，香港中文大学（深圳）正式开源了其研发的语音理解大模型Soundwave，该模型专注于语音与文本…

智能新闻

港中文深圳开源Soundwave语音理解大模型

2025年4月3日

深圳讯 – 在人工智能领域，语音理解一直是研究的热点。近日，香港中文大学（深圳）发布了开源语音理解大模型Soundwave，该模…

智能新闻

OpenAI再出手！GPT-4o迷你语音转录模型发布

2025年4月1日

引言：在人工智能技术日新月异的今天，语音识别与转录技术正逐渐渗透到我们生活的方方面面，从智能助手到在线教育，再到车载系统，语音…

智能新闻

谷歌云再发力：Chirp 3高清语音合成来袭！

2025年3月28日

好的，没问题。我将根据您提供的信息，撰写一篇关于谷歌云Chirp 3高清语音合成模型的新闻报道，力求内容详实、结构清晰、语言生动…

智能新闻

谷歌云再发力：Chirp 3高清语音合成来袭

2025年3月28日

“`markdown 谷歌云推出Chirp 3：高清语音合成模型引领AI语音交互新纪元摘要：谷歌云近日正式发布了…

智能新闻

Oliva：语音搜索向量数据库，开源RAG助手亮相

2025年3月27日

“`markdown 开源语音RAG助手 Oliva：实时语音搜索赋能向量数据库，开启AI交互新纪元摘要： Oli…

智能新闻

港中文深圳开源Soundwave语音理解大模型

2025年3月25日

“`markdown Soundwave：港中文深圳开源语音理解大模型，赋能智能语音交互新纪元深圳，中国 – 香港…

智能新闻

港中文深圳开源Soundwave语音大模型

2025年3月25日

摘要：香港中文大学（深圳）近日开源了其研发的语音理解大模型Soundwave。该模型通过创新的对齐适配器和压缩适配器技术，有效…

智能新闻

OpenAI语音智能体来袭：API价格冰点！

2025年3月22日

旧金山 – 人工智能领域再掀波澜。OpenAI 今日凌晨发布了一系列全新的音频模型，标志着语音智能体时代的正式开启。…

智能新闻

URO-Bench：语音对话AI评测新标杆

2025年3月19日

摘要：随着人工智能技术的飞速发展，语音对话模型在智能家居、个人助理、语言学习等领域的应用日益广泛。然而，如何全面、客观地评估这…

智能新闻

谷歌云重磅发布：Chirp 3高清语音合成

2025年3月19日

好的，我将根据您提供的信息，结合我作为资深新闻记者和编辑的经验，撰写一篇关于谷歌云推出的高清语音合成模型Chirp 3的新闻报道…

智能新闻

出门问问发布TicVoice 7.0，语音合成引擎再升级

2025年3月18日

“`markdown 出门问问发布 TicVoice 7.0：3 秒语音克隆，广播级音质，AI 配音新纪元北京， …

智能新闻

AI语音逼真过头？ Maya开源挑战“恐怖谷”

2025年3月16日

摘要： AI语音助手领域迎来新突破。AI公司Sesame推出逼真语音助手Maya，通过情感智能、上下文记忆和高保真语音生成技术，…

智能新闻

ElevenLabs发布Scribe：语音转文本新突破

2025年3月12日

AI工具集讯近日，知名AI语音公司ElevenLabs正式发布其最新力作——高精度语音转文本模型Scribe。这款模型不仅支持…

智能新闻

ElevenLabs发布Scribe：语音转文本新突破

2025年3月12日

“`markdown ElevenLabs推出Scribe：高精度语音转文本模型革新多语言音频处理摘要： Elev…

智能新闻

URO-Bench：语音对话AI评测新标杆

2025年3月10日

摘要：人工智能语音对话模型正蓬勃发展，但如何全面、客观地评估其性能成为行业难题。URO-Bench应运而生，这款由AI研究者推…

智能新闻

语音AI核弹来袭！秒杀ChatGPT，逼真到上瘾？

2025年3月6日

硅谷报道 – 近日，一款名为CSM（Crossing the Uncanny Valley of Voice）的全新…

智能新闻

CSM-Sesame：对话语音模型新秀登场

2025年3月6日

北京 – 近日，Sesame团队发布了一款名为CSM（Conversational Speech Model）的创新…

智能新闻

西工大开源语音模型，OSUM引关注！

2025年3月5日

引言：在人工智能的浪潮中，语音理解技术正扮演着越来越重要的角色。从智能助手到自动化客服，再到语音驱动的各种应用，精准高效的语音…

智能新闻

AI实时语音转文字工具：WhisperChain文本优化利器

2025年3月5日

摘要： WhisperChain是一款开源的AI实时语音转文字工具，它基于Whisper.cpp实现语音识别，并利用LangCh…

智能新闻

ElevenLabs发布Scribe：语音转文本新突破

2025年2月28日

摘要： ElevenLabs近日发布了其最新力作——高精度语音转文本模型Scribe。该模型专为应对多语言和复杂音频环境而设计，…

智能新闻

ElevenLabs发布Scribe：语音转文本新突破

2025年2月28日

摘要： ElevenLabs近日发布了其最新力作——高精度语音转文本模型Scribe。该模型以其卓越的多语种支持能力、深度音频理…

智能新闻

清华新算法：语音分离效率飙升95%！

2025年2月15日

北京 – 在嘈杂的环境中，人类能够专注于特定的语音信号，这种现象被称为“鸡尾酒会效应”。对于人工智能而言，如何从混合…

智能新闻

豆包语音炸裂上线，中文对话断崖领先！

2025年1月22日

引言：岁末年初，人工智能领域再掀波澜。继去年5月GPT-4o的实时语音功能引发全球关注后，国内AI对话应用“豆包”近日宣布其全…

智能新闻

豆包语音升级：智商情商双爆表，中文对话领跑

2025年1月21日

引言：当人工智能的触角延伸至语音交互领域，一场关于“听懂”与“理解”的革命正在悄然发生。近日，国内人工智能公司字节跳动旗下产品…

智能新闻

Hume AI发布OCTAVE：语音AI新星升起

2025年1月4日

旧金山—— 人工智能领域再次迎来突破性进展。Hume AI，一家专注于情感人工智能研究的公司，近日正式发布了其最新的语音语言模型…

智能新闻

Hume AI发布OCTAVE：语音AI新突破

2025年1月4日

引言：在人工智能领域日新月异的今天，语音交互正逐渐成为人机交互的主流方式。Hume AI，一家专注于情感人工智能研究的公司，近…

智能新闻

Hume AI发布OCTAVE：颠覆语音交互新模型

2024年12月26日

旧金山—— 人工智能领域再次迎来突破性进展。Hume AI，一家专注于情感智能研究的初创公司，近日正式发布了其最新研发的语音语言…

智能新闻

Hume AI发布OCTAVE：颠覆性语音语言模型问世

2024年12月26日

旧金山—— 人工智能领域再次迎来突破性进展。Hume AI，一家专注于情感人工智能研究的创新公司，正式发布了其最新力作——语音语…

智能新闻

Fish Speech 1.5：13语种语音合成 Fish Audio推出13语种AI语音 AI语音新突破：Fish Speec

2024年12月7日

Fish Speech 1.5：多语言语音合成技术的飞跃引言：想象一下，一个能够以13种语言流畅、自然地朗读文本的AI模型，它…

智能新闻

Fish Speech 1.5：13语种AI语音合成 AI语音新突破：Fish Speech 1.5发布 13国语言全覆盖！Fi

2024年12月7日

Fish Speech 1.5：多语言语音合成技术的飞跃引言：想象一下，一个能以13种语言流畅播报新闻、朗读小说，甚至模仿你…

智能新闻

TeleAI 星辰语音大模型再升级，40种方言+英语全通！

2024年11月5日

中国电信 TeleAI 星辰语音大模型升级，支持中英双语及 40 种方言任意混说北京，2024年 11 月 3 日 &#821…

智能新闻

Moonshine：实时语音识别，低延时高准确！

2024年10月25日

引言在当今信息爆炸的时代，语音识别技术正以前所未有的速度发展，为我们提供了更便捷、更自然的交互方式。而实时转录，作为语音识别技…

智能新闻

CleanS2S：流式语音交互，AI开启“听你说”新时代

2024年10月18日

CleanS2S：流式语音到语音交互智能体原型，开启自然流畅的对话新时代引言想象一下，你与智能体进行对话，如同与朋友聊天一样…

智能新闻

Faster Whisper：语音识别新突破，转写推理快如闪电！

2024年10月7日

引言：在信息爆炸的时代，音频内容的快速转写成为了许多人面临的挑战。传统的语音识别工具往往速度缓慢、准确率低，难以满足人们对高效便…

智能新闻

Faster Whisper：语音识别新突破，转写推理快如闪电！

2024年10月7日

Faster Whisper：语音识别的新速度与力量引言：想象一下，你只需轻轻地说出你的想法，就能瞬间将语音转化成文字，无论…

智能新闻

Interspeech2024创新亮相：语音技术加速降本新篇章

2024年9月9日

As a seasoned journalist, I would craft the following article ba…

智能新闻

Interspeech 2024 Speech Tech Revolutionizes with SummaryMixing

2024年9月4日

Self-attention, a key component in many modern deep learning mod…

智能新闻

VoiceCraft：开源语音编辑，文本转语音新突破！

2024年8月28日

开源语音编辑与文本转语音模型VoiceCraft问世，语音合成领域迎来新突破德克萨斯大学奥斯汀分校研究团队近日开源了神经编解码…

智能新闻

豆包大模型首推实时语音通话功能，开启AI对话新纪元

2024年8月16日

英语如下： News Title: “BeanBao AI Model Launches Real-Time Voi…

智能新闻

OpenAI新进展：GPT-4o语音模式今秋全面开放

2024年8月11日

【财联社讯】北京时间7月31日，人工智能研究公司OpenAI宣布，将从即日起向部分ChatGPT Plus用户推出GPT-4o的…

智能新闻

ChatGPT新功能：高级语音模式正式上线

2024年7月31日

随着人工智能技术的不断进步，OpenAI 近日宣布其高级语音模式 ChatGPT 已正式上线，向一小部分 ChatGPT Plu…

2025 年 4 月
一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

标签： 语音

为您推荐

标签：语音