大模型时代,数据库需要“进化”:OceanBase 4.3.3发布,SQL+AI 一体化
AI 时代,数据库需要怎样的“进化”? 这个问题正随着大模型的快速发展而变得越来越迫切。10月23日,独立数据库厂商 OceanBase 在其 2024 年度发布会上给出了答案:OceanBase 4.3.3 版本,升级向量检索与索引功能,实现SQL+AI 一体化,深度融合 AI 与数据库处理能力,支持多模态数据的融合查询,帮助企业简化 AI 技术栈,提升 AI 应用构建效率。
OceanBase CEO 杨冰在发布会上表示,一体化数据库将成为 AI 时代的数据底座。 随着 AI 技术的发展,越来越多的 AI 应用不再局限于纯文本生成回答,涉及的数据类型日益复杂,并且常存储于 IT 架构的不同数据库中。这使得数据库需要具备更强大的处理能力,能够处理和存储不同类型的数据,并支持结构化、半结构化及非结构化数据的复杂融合查询。
OceanBase 4.3.3 版本正是针对这一趋势而推出的。 该版本在向量融合查询的关键能力上取得了显著突破,推出全新的向量检索功能,实现 SQL+AI 一体化。具体而言,在对多模态数据的支持层面,4.3.3 进一步扩展了对复杂数据类型的处理能力,新增 Array 类型,并对 Roaringbitmap 类型数据的计算性能进行了优化,为企业处理多样化数据结构提供更高的灵活性。
在向量融合查询能力上,4.3.3 新增向量检索能力,支持向量数据类型和向量索引,并基于向量索引提供强大的搜索能力。 用户可通过 SQL 及 Python SDK 等方式灵活调用 OceanBase 的向量检索能力,同时结合对海量数据的分布式存储能力、多模数据类型及多类型索引的支持,极大简化 AI 应用的技术栈,助力企业高效构建 AI 应用。
为了更好地满足 AI 应用的需求,OceanBase 4.3.3 版本还对 AP(分析处理)场景进行了大幅性能优化。 尤其是在海量数据分析时,能够提供更短的响应时间和更高的吞吐能力。同时,4.3.3 引入了列存副本的新形态,实现满足 TP 和 AP 负载的物理资源强隔离。该物理隔离机制可确保系统在处理事务型负载时,不受分析型负载的影响,特别是在实时数据分析和决策场景中,能够保持系统的高性能与稳定性。
在发布会上,OceanBase 与蚂蚁集团联合开发的向量库在业内标准的 ANN Benchmarks 基准测试中,针对 GIST-960 数据集表现出色。测试结果显示,该向量库在 ANN Benmarks 测试中性能远超其他算法,排名第一。特别是在 90% 以上的召回率区间,查询性能(QPS)相比此前最优算法 glass 提升 100%,相比基线算法 hnswlib 提升 300%。
OceanBase CTO 杨传辉强调,AI 天然拥抱云,OceanBase 作为一体化数据库,不仅具备云上云下一体化能力,同时具备多云原生开放架构。 这些优势都能有效地帮助客户实现云与 AI 结合,满足客户在云+AI 时代的数据管理需求。
OceanBase 4.3.3 版本的发布,标志着 OceanBase 在 AI 时代迈出了重要一步。 该版本不仅为企业提供了更强大的数据处理能力,也为 AI 应用的构建提供了更便捷的工具。相信随着 OceanBase 在 AI领域的不断探索和创新,将为 AI 时代的数据管理提供更加强大的支持。
以下是一些关于 OceanBase 4.3.3 版本的亮点:
- SQL+AI 一体化: 融合 SQL 与 AI 处理能力,简化 AI 应用开发流程。
- 向量检索与索引: 支持向量数据类型和向量索引,提供强大的搜索能力。
- 多模态数据支持: 扩展对复杂数据类型的处理能力,支持结构化、半结构化及非结构化数据的融合查询。
- 性能优化: 针对AP 场景进行大幅性能优化,提供更短的响应时间和更高的吞吐能力。
- 物理资源隔离: 实现满足 TP 和 AP 负载的物理资源强隔离,确保系统在处理不同负载时的高性能与稳定性。
- 云+AI 能力:具备云上云下一体化能力和多云原生开放架构,满足客户在云+AI 时代的数据管理需求。
OceanBase 4.3.3 版本的发布,不仅是 OceanBase 技术实力的展现,也是其对 AI 时代数据管理趋势的积极响应。相信随着 OceanBase 在 AI 领域的不断探索和创新,将为 AI 时代的数据管理提供更加强大的支持。
Views: 0