Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

0

引言:想象一下,你正与一位朋友热烈地讨论着某个话题,突然,你的 AI 助手插话了,但它说的话却与话题毫无关联,甚至显得突兀。这并非科幻电影中的场景,而是当下 AI 对话领域面临的现实问题。图夫茨大学的一项最新研究揭示了 AI 在对话中的“插话”能力不足,这限制了它们与人类进行自然流畅交流的能力。

研究发现: 研究人员发现,大型语言模型(LLM)在识别“话轮转换点”(TRP)方面表现不佳。TRP 是指对话中合适的插话时机,人类通过观察语调、停顿等副语言信息来判断。然而,LLM 却无法像人类一样准确地识别这些线索。研究表明,即使只提供语言内容,人类也能在单调的语音中找到大部分与自然语音中相同的 TRP,而 LLM 则无法做到。

AI 训练数据的局限性: 研究人员指出,AI 训练数据的局限性是其对话能力不足的主要原因。现有的 LLM 主要基于互联网上的书面内容进行训练,这些内容缺乏大量转录的口语对话。口语对话通常是即兴的,使用更简单的词汇和更短的句子,结构也与书面语言不同。因此,AI 缺乏在真实对话中“成长”的经验,无法自然地理解对话的语境和意图。

克服限制的挑战: 研究人员尝试通过微调 LLM 和使用少量对话内容进行额外训练来提升其对话能力,但效果有限。他们警告称,AI 进行自然对话可能存在根本性的限制,因为它们是基于肤浅的统计相关性来预测下一个单词,而无法真正理解对话的语境和意图。

未来的方向: 研究人员认为,可以通过在更大规模的自然口语语料库上进行预训练来克服这些限制。然而,收集如此规模的数据仍然是一个重大挑战。与互联网上的书面内容相比,可用的对话录音和转录数量要少得多。

结论: AI 对话能力的提升需要克服训练数据不足和算法局限性等挑战。未来,需要更多高质量的口语对话数据来训练 AI,并开发更先进的算法,使 AI 能够真正理解对话的语境和意图,实现更加自然流畅的人机交互。

参考文献:

  • De Ruiter, J. P., et al. (2024). The Turn-Taking Problem in Conversational AI: A Study of the Role of Prosody and Content. arXiv preprint arXiv:2411.00001.

注: 本文参考了 IT 之家的新闻报道,并进行了整理和扩充,以提供更深入的分析和解读。


>>> Read more <<<

Views: 0

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注