中国电信引领光传输技术新篇章

中国电信集团近日宣布,其研究院、北京公司以及天翼云公司联合完成了一项重要技术验证——基于800GWDM现网的千卡分布式无损智算网验证。这一成果标志着我国在分布式智算网络领域迈出了重要一步。

大带宽需求下的技术创新

随着人工智能和大数据技术的快速发展,智算卡的数量已经达到千卡甚至万卡的级别,所需的带宽也相应地达到了百T比特级甚至超P比特级。在这样的背景下,光传输系统的大带宽、高可靠性和高效率成为了保证分布式训练高算效的关键。

中国电信集团采用800G C+L技术,为1024卡规模的分布式集群提供了大容量带宽。通过高阶调制格式的单波长800G技术提高频谱效率,并结合业界热点的C+L波段技术实现超大传输带宽。在中国电信武清与润泽机房之间,利用华为公司的传输设备,构建了一个距离达到120公里的智算验证网。

高可靠性与高效率的保障

为了解决数据传输中的高可靠性问题,中国电信完成了链路误码、波长故障、光纤故障等异常测试试验。测试结果表明,800G业务波中断会导致超过40%的算效降低,而百毫秒级以上的光纤故障甚至会导致算效大幅下降或训练中断。

为了应对这一问题,中国电信采用了WSON重路由恢复技术,将重路由恢复时间控制在50ms以内,从而保证了分布式智算业务的高可靠互联,并最大程度地释放了算效。

此外,针对传输链路的高效率问题,中国电信提出了分钟级波长动态拆建解决方案,以实现算与网的协同分时复用,有效提升了网络资源利用率。

跨越地域、层级、主体的协同调度

此次验证不仅为分布式智算网络提供了技术支持,更为跨地域、跨层级、跨主体的高可靠算力协同调度奠定了基础。这将为未来的分布式训练和智算网络建设提供重要的参考和借鉴。

结语

中国电信的这一创新成果,不仅展示了其在光传输技术领域的深厚实力,也为整个分布式智算网络的发展提供了新的思路和方向。未来,随着技术的不断进步和应用场景的拓展,我们有理由相信,分布式智算网络将在更多领域发挥出巨大的潜力。


read more

Views: 0

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注