英伟达联手Meta发布Llama 3.1 4B参数模型

8 月 27, 2024 #Llama1, #Meta, #伟达, #每日AI快讯

英伟达携手Meta推出轻量级AI模型 Llama-3.1-Minitron，助力AI应用落地

北京时间2023年10月26日 – 英伟达与Meta联合宣布推出 Llama-3.1-Minitron，一款基于Llama3.1 8B模型精炼而成的4B参数模型。该模型通过剪枝和知识蒸馏技术，在保持核心性能的同时，显著降低了模型大小和复杂性，为AI应用的广泛落地提供了有力支持。

Llama-3.1-Minitron 4B在多个基准测试中表现优异，与更大模型相比具有竞争力。同时，该模型在FP8精度下吞吐量提升显著，使其成为AI绘画、写作等领域中高效、强大的技术支持。

轻量级模型，高效性能

Llama-3.1-Minitron 4B的核心优势在于其轻量级设计。通过剪枝和知识蒸馏技术，该模型有效减少了参数数量，使其能够在资源有限的设备上运行，例如移动设备或嵌入式系统。

剪枝技术通过结构化剪枝减少模型中的层数和神经元，降低模型的复杂性和大小。该技术分为深度剪枝和宽度剪枝两种方式，前者删除模型的部分层，后者缩减嵌入维度和MLP中间层的规模。

知识蒸馏则是一种训练技术，其中一个较小的学生模型被训练来模仿一个更大的教师模型的行为。这种技术可以将教师模型的预测能力保留在学生模型中，同时提高效率和速度。

应用广泛，潜力巨大

Llama-3.1-Minitron 4B的应用场景十分广泛，包括：

未来展望

英伟达和Meta表示，未来将继续致力于开发更轻量级、更高效的AI模型，推动AI技术在更多领域落地，为人们的生活带来更多便利。

项目地址:

Llama-3.1-Minitron 4B的推出，标志着AI模型发展进入了一个新的阶段。轻量级模型的出现，将进一步推动AI技术的普及和应用，为人们的生活带来更多可能性。

【source】https://ai-bot.cn/llama-3-1-minitron/

11 月 24, 2024 智能小编

11 月 24, 2024 智能小编

11 月 24, 2024 智能小编