引言:
在人工智能(AI)的浪潮席卷各行各业之际,人们的目光往往聚焦于大模型和算法的创新。然而,正如冰山之下隐藏着巨大的基石,支撑AI应用的数据基础设施正悄然发生着深刻的变革。数据库,这个看似幕后的角色,正站在下一波AI影响浪潮的中心。本文将深入探讨数据库行业如何迎接AI带来的挑战与机遇,并揭示下一代数据库内核的关键设计要点。
主体:
AI业务的本质:数据驱动的变革
PingCAP联合创始人兼CTO黄东旭指出,当前许多AI业务的本质仍然是数据业务。尽管大模型和人工智能吸引了大量关注,但其最终落地和应用离不开强大的数据技术支撑。近期AI数据分析平台Databricks的百亿美元融资也印证了这一趋势,其99%的营收仍来自数据业务,表明Data+AI融合的趋势远超预期。
随着AI从“Amazing”到“x Everything”的演变,业界开始探索利用AI改造现有应用。黄东旭认为,未来AI的核心在于“From ‘AI’ to ‘Your Own AI’”,即让AI能够访问并有效利用人与世界互动产生的数据。这其中,数据的来源、存储方式和使用策略至关重要。
RAG:大模型落地的关键
在尝试使用高质量行业数据和个人数据,基于开源基础模型进行微调的过程中,黄东旭团队发现微调的方向不可控,且迭代周期长、成本高。因此,他们得出结论:在可预见的未来,能够让大模型真正发挥作用的只有检索增强生成(RAG)。
RAG的商业模式中,大型语言模型本身并不重要,真正宝贵的是数据。黄东旭预言,数据库将成为下一波受AI影响最大的行业。然而,大模型和RAG对数据基础设施提出了新的要求:
- 向量索引: RAG应用需要整合向量搜索、检索、知识图谱等多种技术。预计2025年主流数据库将支持向量索引类型,单独的向量数据库市场增长将停滞。
- 多模态数据支持: 需要记录与系统的交互记录,包括公司文档、产品文档和结构化数据等,这些元素构成了RAG应用的核心。一个能够实现一站式服务的多模态数据库解决方案将越发流行。
为了应对这一趋势,PingCAP发布了TiDB v8.5 LTS,引入了强大的向量搜索功能,并保持了与MySQL语法风格的一致性,方便开发者构建AI应用。
下一代数据库:云原生与AI的融合
除了支持AI应用,下一代数据库还应具备足够的可扩展性、灵活性、成本效益和简洁性。
- 可扩展性: 数据库需要支持更多数据维度上的扩展,包括连接数、表库数量、后台任务的扩展性等。TiDB 8.5版本每个集群支持超过100万张表,并确保跨租户的一致查询性能。
- 灵活性: 进入AI时代,数据请求的主体将从人变成AI,数据库必须跳出过去的固有限制。数据库本身的限制不能反过来成为应用层面的限制。
- 成本效益: 随着数据量和数据维度的爆发式增长,规模和灵活性两个因素叠加将带来指数级的复杂性。未来的数据库一定是云原生与AI的结合。
PingCAP认为,下一代数据库内核的关键设计要点包括:
- 使用对象存储多OLTP引擎: 规避分布式存储引擎带来的复杂性问题,同时最大限度地降低成本。数据库将变成一组微服务的组合,每个模块都在自我迭代,只需保持Serverless接口的稳定性。
- 实现真正的多租户: 在保证重要业务安全可靠隔离的情况下,在逻辑上把资源分配给其它优先级更低的业务使用。TiDB 8.5增强了资源组的管理能力,允许根据不同业务应用的需求设置资源使用上限,并控制后台任务的资源消耗。
黄东旭强调,新一代引擎的重点在于未来3年内的持续迭代、创新和验证,最终希望可以逐步演进到“TiDB one”的状态,用单一数据库解决各种复杂问题,简化开发者的工作。
TiDB V9:All-in-one的愿景
PingCAP研发副总裁唐刘透露,明年发布的TiDB V9版本将继续专注于“All-in-one”的目标,提供更强大的数据管理和分析能力。
结论:
数据库行业正经历一场由AI驱动的深刻变革。从RAG的兴起,到云原生和多租户的演进,数据库不再仅仅是数据的存储容器,而是成为AI应用的核心基础设施。未来,一个能够实现一站式服务、支持多模态数据、具备高度可扩展性和灵活性的数据库解决方案将成为主流。这场变革不仅将重塑数据库行业,也将深刻影响AI的未来发展。
参考文献:
- InfoQ 作者 | 高玉娴. (2025, January 10). 数据库将成为下一波受 AI 影响最大的行业. Retrieved from [原文链接]
- (请根据实际情况添加其他引用的资料)
注:
- 本文使用了Markdown格式,方便阅读和编辑。
- 文中引用了PingCAP联合创始人兼CTO黄东旭的观点,并对其团队的研究成果进行了总结。
- 文章对数据库行业未来的发展趋势进行了展望,并提出了下一代数据库的关键设计要点。
- 本文对RAG(检索增强生成)技术进行了重点阐述,强调了其在大模型落地过程中的重要作用。
- 本文强调了数据在AI应用中的核心地位,以及数据库在AI时代所扮演的关键角色。
- 本文对TiDB 8.5和TiDB V9进行了介绍,并阐述了PingCAP在数据库领域的愿景。
Views: 0