Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

0

伦敦/北京 – 谷歌 DeepMind 近日发布了其最新人工智能系统 AlphaGeometry2,该系统在解决复杂几何问题方面取得了突破性进展,尤其是在国际数学奥林匹克竞赛 (IMO) 级别的难题上。这项技术不仅展示了 AI 在数学领域的巨大潜力,也为未来的数学教育和研究开辟了新的可能性。

AlphaGeometry2 并非简单的计算器,它结合了神经符号方法,巧妙地将谷歌 Gemini 系列的语言模型与符号引擎相结合。这意味着它既能像人类一样进行直觉性的几何构造预测,又能像计算机一样进行严谨的逻辑推理。

超越金牌得主的解题能力

根据 DeepMind 公布的数据,AlphaGeometry2 在过去 25 年的 IMO 几何问题中取得了 84% 的解题率。这一成绩不仅远超以往的 AI 系统,甚至超越了人类金牌得主的平均水平。这表明 AlphaGeometry2 已经具备了在复杂几何问题上与顶尖人类专家相媲美的能力。

技术原理:神经符号方法的巧妙融合

AlphaGeometry2 的核心在于其神经符号方法。Gemini 系列的语言模型负责预测解题所需的辅助几何构造,例如添加新的点、线或圆。而符号引擎,即 DDAR2 (Deductive Database Arithmetic Reasoning),则负责基于严格的数学规则进行推理和证明。

DDAR2 是一种计算演绎闭包的算法,它从一组初始事实出发,通过固定的推理规则逐步推导出所有可能的事实,直到无法再推导为止。DeepMind 对 DDAR2 进行了多项改进,包括处理重合点的能力、更快的算法实现(从 Python 改为 C++,速度提升 300 倍),以及更高效的规则应用。

此外,AlphaGeometry2 还采用了 SKEST (基于知识共享集成的搜索树) 的并行搜索算法。该算法通过多个配置不同的搜索树并行运行,每个节点对应一次辅助构造尝试和符号引擎的运行。如果尝试成功,则所有搜索树终止;如果失败,成功证明的事实会被记录到共享事实库中,供其他节点使用。

数据驱动:3 亿个定理和证明的训练

为了解决几何问题训练数据匮乏的问题,DeepMind 采取了合成数据训练的方法。他们生成了超过 3 亿个不同复杂度的定理和证明用于训练 AlphaGeometry2。这种大规模的数据训练是 AlphaGeometry2 取得突破性进展的关键因素之一。

应用前景:数学教育、研究和形式化推理

AlphaGeometry2 的成功不仅仅局限于数学竞赛。它在数学教育、研究和形式化推理等领域都具有广阔的应用前景:

  • 数学教育: AlphaGeometry2 可以作为数学教育中的辅助工具,帮助学生和教师更好地理解和解决复杂的几何问题。通过展示解题过程和逻辑推理,能为学生提供学习和练习的范例。
  • 数学研究: AlphaGeometry2 的技术可以扩展到数学研究领域,在需要复杂几何推理和证明的场景中。能为数学家提供新的思路和方法,帮助解决尚未解决的几何问题。
  • 形式化数学推理: 结合 AlphaProof 等其他 AI 模型,AlphaGeometry2 可以用于形式化数学推理,验证数学定理的正确性。

挑战与展望

尽管 AlphaGeometry2 取得了显著的成就,但它仍然面临着一些挑战。例如,如何进一步提高其在更复杂、更抽象的几何问题上的解题能力?如何将其技术推广到其他数学领域?这些问题都值得进一步研究和探索。

DeepMind 的 AlphaGeometry2 代表了 AI 在数学领域的一次重大突破。它不仅展示了 AI 在解决复杂问题方面的强大潜力,也为未来的数学教育和研究开辟了新的可能性。随着 AI 技术的不断发展,我们有理由相信,AI 将在数学领域发挥越来越重要的作用。

参考文献:


>>> Read more <<<

Views: 0

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注