上海的陆家嘴

OpenTelemetry 持续剖析数据模型落地:Elastic 捐赠加速标准化进程

InfoQ 2024-09-16 – OpenTelemetry宣布将持续剖析(Continuous Profiling)作为其核心遥测信号,并宣布 Elastic 已将其持续剖析代理捐赠给了 OpenTelemetry 项目。这一举措标志着 OpenTelemetry 在持续剖析领域迈出了重要一步,将进一步推动可观测性领域的标准化进程。

Elastic 的捐赠为 OpenTelemetry 生态系统带来了一个基于 eBPF 的生产级持续剖析代理。该代理能够以极低的性能开销提供全系统、始终在线的剖析功能,有效解决了传统剖析方法的诸多局限性。

持续剖析:超越传统方法的优势

持续剖析作为 OpenTelemetry 的第四个关键信号,与跟踪、指标和日志并列,在可观测性系统中拥有显著优势。它消除了对中断服务重启的需求,降低了代码插装带来的性能开销,并提供了对第三方库的可视化,这些库在传统剖析方法中难以进行分析。

OpenTelemetry 持续剖析数据模型:标准化之路

OpenTelemetry 持续剖析数据模型的落地并非一蹴而就。早在 2023 年 3 月,OpenTelemetry 增强提案(OTEP)就已合并了剖析数据模型,并成立了专门的特别兴趣小组(SIG)来推动持续剖析标准化方法的开发。

SIG 剖析小组面临着诸多挑战,包括:

  • 在现有数据模型基础上构建还是创建一个全新的数据模型?
  • 如何在特定于领域的剖析惯例和 OpenTelemetry 特定于框架的惯例之间保持平衡?
  • 选择合适的现有剖析格式作为基础?
  • 如何将剖析数据集成到 OpenTelemetry 收集器中?

最终,OpenTelemetry 采用了扩展版本的 pprof 格式(称为“pprof-extended”)作为其剖析数据标准,并制定了将数据提取、解构成收集器的内部格式“pdata”,然后与其他遥测信号一起统一处理的模式。

持续剖析的应用场景

持续剖析的应用场景远超传统的性能和成本分析。它可以用于信号相关性、事件响应和详细的资源消耗分析,并能够有效识别 CPU 峰值、内存问题、互斥争用和网络抖动等问题。

OpenTelemetry 持续剖析的意义

OpenTelemetry 中添加持续剖析将有助于工程师识别资源密集型代码,并通过减少对专有 APM 代理的依赖来提高供应商中立性。

eBPF 技术的应用

eBPF 技术的集成是持续剖析解决方案的重要趋势。Elastic 捐赠的代理正是基于 eBPF 技术,能够以最小的开销进行全面的系统范围内的剖析。

行业趋势与未来展望

OpenTelemetry 社区对持续剖析的采用与不断增长的行业趋势保持一致。越来越多的初创公司和主要的可观测性供应商开始关注持续剖析,并认识到其与其他遥测信号关联时的价值。

未来,OpenTelemetry 持续剖析将继续发展,并与其他可观测性技术深度融合,为开发者提供更加强大、高效的工具,帮助他们更好地理解和优化应用程序性能。


>>> Read more <<<

Views: 0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注