上海枫泾古镇正门_20240824上海枫泾古镇正门_20240824

亚马逊AI王炸:六大模型、3nm芯片、全球最大AI集群,苹果罕见站台

引言: 在拉斯维加斯举行的AWS re:Invent 2024大会上,亚马逊云科技(AWS)掀起了一场AI风暴。六款全新自研大模型、革命性的3nm AI训练芯片Trainium 3、全球最大AI计算集群以及苹果的罕见站台,共同构成了亚马逊在AI领域的一次史无前例的强势宣告,预示着云计算巨头在生成式AI领域的全面进击。

主体:

一、Amazon Nova:六款大模型的多模态盛宴

亚马逊发布了Amazon Nova系列六款大模型,涵盖文本、图像和视频生成,标志着其在生成式AI领域迈出了关键一步。 Nova系列包含四个不同版本的语言模型:Micro(低延迟、高速度)、Lite(低成本多模态)、Pro(平衡性能和成本的多模态)以及Premier(功能最强大的多模态模型,将于2025年第一季度推出)。 此外,图像生成模型Canvas和视频生成模型Reel也加入了Nova家族。Reel目前支持生成6秒视频,未来将扩展至2分钟,为广告和内容创作提供了新的可能性。 值得关注的是,亚马逊承诺在2025年初,部分Nova模型的上下文窗口将扩展至超过200万个token,这将显著提升模型处理复杂任务的能力。 在基准测试中,Nova模型展现出了与市场领先模型(如Gemini和Llama)相媲美的性能,甚至在某些方面超越了它们。 更令人期待的是,亚马逊计划在明年推出语音转语音模型和“任意转任意”多模态模型,实现文本、图像、音频和视频之间的无缝转换。

二、Trainium 3和Trn2 UltraServer:硬件实力的全面升级

为了支撑其雄心勃勃的AI战略,亚马逊推出了第三代自研AI训练芯片Trainium 3,采用3nm工艺制程,性能较上一代提升一倍,能效提升40%。 同时发布的Trn2 UltraServer,通过将64颗Trainium 2芯片互连,实现了高达83.2 PFLOPS的峰值算力,是现有EC2 AI服务器的5倍以上,内存提升10倍,足以应对万亿参数AI模型的训练和推理。 Trainium 3预计将于2025年底上市,进一步巩固亚马逊在AI硬件领域的领先地位。 目前,Trn2实例已与Adobe、Databricks等多家企业展开合作,用于大模型训练。

三、与Anthropic的战略合作:构建全球最大AI计算集群

亚马逊与Anthropic的合作进一步深化。双方将共同构建全球最大的机器学习训练计算集群,用于Anthropic下一代Claude大模型的训练,该集群将包含数十万颗Trainium 2芯片。 这笔高达80亿美元的投资,表明亚马逊对Anthropic及其大模型技术的坚定信心,也彰显了其在AI领域长期投入的决心。 此次合作还带来了Claude 3.5 Haiku延迟优化版,推理速度提升了60%。

四、苹果的罕见站台:AWS服务的强大背书

苹果机器学习和人工智能高级总监Benoit Dupin的现场站台,为AWS提供了强有力的背书。Dupin分享了苹果在多个产品和服务中广泛使用AWS服务的情况,并强调了AWS芯片在机器学习推理工作负载方面的效率提升,这为AWS的AI技术和服务提供了极高的认可度。

结论:

亚马逊在AWS re:Invent 2024大会上展现了其在AI领域的强大实力和远大抱负。 六款大模型、先进的AI芯片和全球最大AI计算集群的组合,标志着亚马逊在生成式AI领域的全面进击。 与Anthropic的深度合作和苹果的罕见站台,进一步巩固了亚马逊在云计算和AI领域的领导地位。 未来,亚马逊的AI战略将对云计算产业和全球AI发展产生深远的影响,值得持续关注。 然而,未来挑战依然存在,包括模型安全、能源消耗以及与其他AI巨头的竞争等。

参考文献:

  • 智东西. (2024, December 3). 亚马逊年末甩王炸!6款大模型、3nm AI芯片、全球最大AI计算集群,苹果罕见站台. [新闻链接,如果可获得请补充]
  • AWS re:Invent 2024 大会官方资料 (如果可获得请补充)

(注:由于无法访问实时新闻链接,参考文献部分仅为示例,请根据实际情况补充完整。)


>>> Read more <<<

Views: 0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注