Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

0

好的,根据你提供的信息,我将以一名资深新闻记者和编辑的视角,撰写一篇关于余弦相似度在机器学习领域面临挑战的深度报道。

标题: 余弦相似度“失灵”?机器学习的“尺子”为何会随机伸缩

引言:

在机器学习和数据科学的广阔天地里,余弦相似度长期以来被视为一把衡量高维数据对象之间语义相似度的“金尺”。从推荐系统到自然语言处理,它无处不在,其流行源于人们对它能够捕捉向量方向对齐的信任,认为它比简单的点积更能体现相似性。然而,最近一项来自 Netflix 和康奈尔大学的联合研究,如同在平静的湖面投下一颗巨石,引发了业界对这一“金尺”可靠性的深刻反思:余弦相似度,或许并非我们想象的那般可靠,甚至可能导致任意且毫无意义的结果。这究竟是怎么回事?我们又该如何应对这一挑战?

主体:

余弦相似度的“信任危机”

余弦相似度,顾名思义,是通过计算两个向量夹角的余弦值来衡量它们之间的相似程度。在机器学习中,我们常常将高维对象转化为低维的嵌入向量,再通过余弦相似度来量化它们之间的语义关联。长期以来,这种方法被认为是有效的,但Netflix和康奈尔大学的研究团队却发现,在某些情况下,余弦相似度可能会“失灵”,甚至给出完全错误的结果。

这项研究的核心发现,来自于对正则化线性模型嵌入的分析。研究人员发现,对于某些线性模型,相似度并非唯一,而是受到正则化参数的隐式控制。这意味着,即使模型的预测结果保持不变,通过调整正则化参数,我们也可以得到完全不同的余弦相似度结果。这就像我们用一把会随机伸缩的尺子去测量物体,结果自然是不可靠的。

线性模型中的“自由度”陷阱

研究人员深入分析了矩阵分解(MF)模型,这是一种常用于推荐系统的线性模型。他们发现,在某些优化目标下,学习到的嵌入中存在一个关键的自由度,允许对嵌入维度进行任意缩放,而不会影响模型的预测结果。

具体来说,如果 Â 是某个优化目标的解,那么对于任意对角矩阵 DÂDB̂D^(-1) 也是解。这种缩放会影响学习到的嵌入的归一化,从而影响它们之间的余弦相似度。

为了更直观地理解,研究人员给出了两个例子:

  1. 全秩MF模型: 通过巧妙地选择对角矩阵 D,可以使得item-item的余弦相似度等于单位矩阵,这意味着每个item只和自己相似,而和其他item完全不相似,这显然是荒谬的。
  2. 用户-用户相似度: 通过选择不同的 D,用户-用户余弦相似度可以简化为仅基于原始数据矩阵的表达式,完全没有利用到学习的嵌入,这使得相似度计算失去了意义。

这些例子有力地说明了余弦相似度在某些线性模型中可能产生任意结果,并非真正反映了嵌入向量之间的语义关系。

深度学习中的“隐式”风险

问题不仅限于线性模型。研究人员指出,在深度学习模型中,由于常常使用多种正则化技术,这些技术可能会对最终嵌入的余弦相似度产生意想不到的影响。此外,在通过点积优化学习嵌入时,如果直接使用余弦相似度,可能会得到难以解释且没有实际意义的结果。这进一步揭示了余弦相似度在复杂模型中存在的潜在风险。

替代方案:寻找更可靠的“尺子”

面对余弦相似度的“失灵”,我们该如何应对?研究人员和相关领域的专家提出了一些替代方案:

  1. 直接针对余弦相似度训练模型: 这可能需要借助层归一化等技术,以确保模型学习到的嵌入能够更好地反映语义相似性。
  2. 避免在嵌入空间中工作: 相反,在应用余弦相似度之前,先将嵌入投影回原始空间,这或许可以减少嵌入空间中自由度带来的干扰。
  3. 在学习过程中或之前应用归一化: 而不是像余弦相似度那样仅在学习后进行归一化,这有助于减少正则化带来的偏差。
  4. 探索其他相似度度量:
    • 欧几里得距离: 虽然对向量大小敏感,但在嵌入经过适当归一化时可以发挥作用。
    • 点积: 在某些情况下,非归一化的点积可能优于余弦相似度,尤其是在密集段落检索和问答任务中。
    • 软余弦相似度: 这种方法考虑了词与词之间的相似性,可能提供更细致的比较。
    • 语义文本相似度(STS)预测: 专门为语义相似度任务训练的微调模型,有望提供更稳健和可解释的相似度度量。

社区反思与未来展望

这篇研究论文和相关的讨论在机器学习社区引发了广泛的反思。一些研究人员认为,问题并非余弦相似度本身,而是我们对它的盲目使用。他们认为,相似度指标需要根据嵌入空间进行量身定制,需要测试不同的指标来建立定性评估。

无论如何,这项研究提醒我们,在机器学习领域,没有绝对完美的“银弹”。我们必须对常用的工具保持批判性思维,深入理解其局限性,并不断探索更可靠的替代方案。未来,我们期待看到更多关于相似度度量的研究,以及更有效、更稳健的机器学习模型。

结论:

Netflix和康奈尔大学的研究,无疑给机器学习领域敲响了警钟。余弦相似度并非万能,它在某些情况下可能产生任意且毫无意义的结果。这要求我们重新审视这一常用的度量方法,并在实践中更加谨慎地使用。正如那句古老的谚语所说,“工欲善其事,必先利其器”。在机器学习的道路上,我们需要不断打磨我们的“工具”,才能更好地探索未知的领域。

参考文献:

(注:以上参考文献已采用链接形式,并遵循了APA引用格式的原则)

希望这篇报道符合您的要求,并能为读者提供有价值的信息和思考。


>>> Read more <<<

Views: 0

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注