Hugging Face发布紧凑型大语言模型SmolLM2

SmolLM2：Hugging Face 推出的紧凑型大语言模型，为设备端应用带来新可能

引言

在人工智能领域，大型语言模型（LLM）的应用范围正在不断扩展，从文本生成到代码编写，它们正在改变着我们与信息交互的方式。然而，大多数 LLM 依赖于强大的云计算资源，这限制了它们在设备端应用的潜力。为了克服这一挑战，Hugging Face 推出了 SmolLM2，一个紧凑型大语言模型，专为在资源有限的设备上运行而设计。

SmolLM2 的核心优势

SmolLM2 提供了三种不同参数级别的模型：1.7B、360M 和 135M，以适应不同的应用场景和资源限制。尽管体积小巧，SmolLM2 在理解和执行指令、进行知识推理及解决数学问题方面表现出色。

SmolLM2 的主要功能

文本重写：SmolLM2 可以对文本进行重写，使其更加精炼或符合特定的风格和要求。
摘要生成：模型可以从较长的文本中提取关键信息，生成简洁的摘要。
函数调用：SmolLM2 支持函数调用，使其成为自动编码助手或需要与现有软件无缝集成的个人 AI 应用程序的理想选择。
设备端运行：SmolLM2 可以直接在本地设备上运行，无需依赖云基础设施，这对于延迟、隐私和硬件限制重要的应用场景至关重要。
多任务处理：模型针对多种自然语言处理任务进行了优化，使其适用于各种应用程序，尤其是在与云服务连接受限的设备上。

SmolLM2 的技术原理

SmolLM2 采用了一系列先进的后训练技术，包括监督微调 (SFT) 和直接偏好优化 (DPO)，以增强模型处理复杂指令和提供更准确响应的能力。此外，SmolLM2 与 llama.cpp 和 Transformers.js 等框架兼容，使其能够在本地 CPU 处理和浏览器环境中高效运行，无需专门的GPU。

SmolLM2 的应用场景