谷歌AI播客刚火,Meta就开源了平替,效果却一言难尽
引言: 随着谷歌和 Meta 相继推出基于大语言模型的 AI 播客功能,将极大地丰富人类用户与 AI 智能体互动的体验。然而,Meta 刚刚开源的 NotebookLlama,作为谷歌 NotebookLM 的平替版,其效果却引发了争议。
AI 播客的新时代: 上个月,谷歌宣布对旗下 AI 笔记应用 NotebookLM 进行一系列更新,允许用户生成 YouTube 视频和音频文件的摘要,甚至可以创建可共享的 AI 生成音频讨论。这使得 NotebookLM 的用例和覆盖范围进一步扩大,并吸引了众多用户,包括 AI 大牛 Karpathy,他利用 NotebookLM 创建了一个 10 集的系列博客,将每个主题的维基百科条目链接在一起,并生成播客视频。
Meta 的开源平替: 为了应对谷歌的领先优势,Meta 推出了 NotebookLlama,它使用 Llama 模型进行大部分任务处理,包括 Llama-3.2-1B-Instruct、Llama-3.1-70B-Instruct 和 Llama-3.1-8B-Instruct。NotebookLlama 的运行流程是先从文件创建转录文本,然后添加「更多戏剧化」和中断,最后将转录文本馈入到开放的文本到语音模型。
效果争议: 然而,据外媒 Techcrunch 报道,NotebookLlama 的效果听起来不如谷歌 NotebookLM 好,带有明显的机器人口音,并且往往会在奇怪的时刻「互相交谈」。Meta 研究人员承认,使用更强大的模型可以提高质量,但目前文本到语音模型限制了声音的自然程度。
用户反馈: 一些用户直言 NotebookLlama 的效果糟糕透了,要想真正地对标谷歌的 NotebookLM,就要在语音转换效果上接近人类水平。不过也有人认为,虽然目前效果不佳,但随着所有代码的开源,用户可以自定义尝试不同的提示方法等,相信未来会变得更好。
Meta 的下一步: 目前,Meta 只使用了一个模型来编写播客大纲,未来可能会尝试使用两个智能体就感兴趣的主题进行讨论,以提高播客内容的质量。
结论: 尽管 Meta 的 NotebookLlama 在效果上还有待提升,但它仍然是一个具有潜力的开源项目。随着技术的不断发展,相信 NotebookLlama会在未来取得更大的进步,为用户提供更优质的 AI 播客体验。
参考文献:
注: 本文根据提供的新闻信息进行创作,并加入了个人观点和分析,以提供更全面的信息和思考。
Views: 0