Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

0

正文:

【北京,2024年9月4日讯】在数据库顶级会议VLDB 2024上,字节跳动团队公布了一项重要的研究成果——ResLake,这是一个多机房资源统一管理系统,旨在优化大数据作业的运行效率和资源利用率。

随着大数据作业在全球数十个数据中心运行,字节跳动面临着跨机房带宽用尽的风险,这不仅会影响其他业务的运作,还会造成不同机房的资源负载不均衡。为解决这一问题,字节跳动的基础架构计算团队、存储团队、应用研究中心和系统部网络团队共同研发了ResLake系统。

ResLake通过作业调度、数据调度、网络管控等手段,具备资源的全局视角,能够显著优化计算和存储的布局,有效降低业务运营成本。系统上线后,作业平均完成时间(Job Completion Time, JCT)降低了20%,机房间资源利用率均衡性提升了53%,跨机房流量降低了50%,存储成本降低了46%。

以下是ResLake系统的关键特点和架构设计:

背景介绍:
– 大数据作业与数据表之间存在复杂的关联,近50%的作业存在跨机房读数据,34%的作业从超过1个远程机房读取。
– 考虑到数据高可用和单机房容量限制,数据通常以多副本形式存储在多个物理机房中。

架构设计:
– 中心化的资源管理系统ResLake采用分层架构,包括控制层、计算层、存储层和网络层。
– 控制层负责与计算层、存储层、网络层进行交互,实时对作业布局进行最优调度决策。
– 计算层负责全域计算资源管理,存储层负责全域存储资源管理,网络层负责全域网络监控和管控。

系统输入与输出:
– 用户提交作业时需指定计算资源Quota,网络带宽资源由ResLake统一分配。
– 系统输出为经过ResLake决策的作业机房和集群。

调度模型:
– 调度模型包括等待调度阶段、全局调度阶段、数据准备阶段、集群调度和数据输出阶段。
– 优化目标为最小化JCT时间和资源负载均衡。

系统实现:
– 控制层维护资源的全局状态视图,进行作业调度和资源平衡决策。
– 存储层提供元数据查询能力,支持作业数据亲和性调度决策。

ResLake的成功实施不仅提升了字节跳动的数据处理效率,也为大数据作业的资源管理提供了新的思路和方法。论文详情可访问VLDB官方网站查看。

【结束】

注:本文为虚构新闻稿件,用于模拟新闻媒体对字节跳动ResLake系统的报道。


read more

Views: 6

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注