Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

0

纽约,[日期] – IBM 近日宣布开源其 Granite 3.2 多模态 AI 模型系列,旨在为开发者和企业提供强大的推理、视觉理解和预测能力。这一举措标志着 IBM 在推动 AI 技术普及和开放创新方面的又一重要里程碑。

Granite 3.2 系列包含多个版本,其中最引人注目的是 Granite 3.2 Instruct 和 Granite Vision 3.2 2B。Granite 3.2 Instruct 提供实验性的链式推理能力,能够显著提升复杂指令的执行性能。而 Granite Vision 3.2 2B 则是首个视觉语言模型,专注于文档理解,其性能甚至可以媲美更大规模的模型。

Granite 3.2 的核心功能包括:

  • 增强的推理能力: Granite 3.2 Instruct 通过引入“逐步思考”的提示工程,显著提升了模型在逻辑推理任务中的表现。这种链式推理能力使得模型能够更好地处理复杂指令,例如代码生成、数学计算和逻辑推理。
  • 多模态理解: Granite Vision 3.2 2B 基于 Transformer 架构,结合了视觉和文本输入,专注于文档理解。通过在专门的文档理解数据集(如 DocFM)上进行指令调优,该模型能够优化对文档和图表的理解能力,适用于文档问答、图表分析和关键信息提取等应用场景。
  • 安全监控: Granite Guardian 3.2 是一款安全监控模型,旨在检测输入和输出中的风险,保障内容安全。该模型利用强化学习优化风险检测能力,并引入“表达置信度”功能,提供更细致的风险评估。

技术原理与创新

Granite 3.2 的技术亮点在于其链式推理、多模态融合、稀疏嵌入和时间序列预测技术。

  • 链式推理: 通过引入“逐步思考”的提示工程,模型能够模拟人类的思考过程,逐步解决复杂问题,从而提升推理性能。
  • 多模态融合: Granite Vision 3.2 2B 将视觉和文本信息融合在一起,使得模型能够更好地理解文档和图表等复杂信息。
  • 稀疏嵌入: 与传统的密集嵌入不同,稀疏嵌入的每个维度直接对应模型词汇表中的一个词,可解释性强,适用于短文本检索和匹配任务。
  • 时间序列预测: 通过轻量级的频率前缀调整技术,模型能够快速适应不同频率的输入数据,适用于金融、气象和能源领域的短期到长期预测。

应用场景

Granite 3.2 具有广泛的应用前景,包括:

  • 复杂任务自动化: 适用于执行复杂指令,如代码生成、数学计算和逻辑推理。
  • 文档理解: 适用于处理文档问答、图表分析和关键信息提取。
  • 时间序列预测: 支持金融、气象和能源领域的短期到长期预测。
  • 安全监控: 检测输入输出中的风险,保障内容安全。
  • 文本检索: 优化短文本检索和匹配,提升信息查找效率。

开源与未来展望

IBM 此次开源 Granite 3.2 系列模型,旨在促进 AI 技术的开放创新和广泛应用。开发者可以通过以下链接获取更多信息:

IBM 表示,将继续投入 AI 技术的研发,并积极推动 AI 技术的开源和普及,为开发者和企业提供更多创新工具和解决方案。

分析与评论

IBM 开源 Granite 3.2 多模态 AI 模型,是其 AI 战略的重要一步。通过开源,IBM 能够吸引更多的开发者参与到模型的改进和应用中来,从而加速 AI 技术的创新和发展。Granite 3.2 的强大功能和广泛应用前景,使其有望成为 AI 领域的一款重要工具,为各行各业带来新的机遇。然而,模型的实际性能和应用效果还需要在实践中进一步验证。同时,安全监控模型的有效性也需要持续关注,以确保 AI 技术的安全可靠应用。

参考文献


>>> Read more <<<

Views: 0

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注