ML笔记：使用huggingface 开发的trl库进行大模型微调时，SFTTrainer 怎么配置模型结果保存频次的参数

作者既智

8 月 10, 2024 #AI, #大模型, #微调

黄山的油菜花

在使用 Hugging Face 开发的 TRL 库进行大模型微调时，可以通过配置 SFTTrainer 的参数来控制模型结果保存的频次。以下是具体的步骤和相关参数的说明：

1. 安装必要的库

首先，确保你已经安装了必要的库：

pip install transformers datasets trl accelerate

2. 配置 `SFTTrainer`

在使用 SFTTrainer 时，可以通过传递 TrainingArguments 来配置模型保存的频次。TrainingArguments 是 Hugging Face transformers 库中的一个类，用于控制训练过程中的各种参数。

以下是一个示例代码，展示了如何配置 SFTTrainer 并设置模型保存频次：

from transformers import TrainingArguments, Trainer
from trl import SFTTrainer
from datasets import load_dataset

加载数据集

dataset = load_dataset(“your_dataset_name”)

定义训练参数

training_args = TrainingArguments(
output_dir=”./results”, # 模型保存路径
save_steps=500, # 每500步保存一次模型
save_total_limit=3, # 最多保存3个模型检查点
evaluation_strategy=”steps”, # 评估策略
eval_steps=500, # 每500步进行一次评估

[1] https://blog.csdn.net/FrenzyTechAI/article/details/135864583
[2] https://huggingface.co/docs/transformers/main/zh/main_classes/trainer
[3] https://blog.csdn.net/u012856866/article/details/139502628
[4] https://cloud.tencent.com/developer/news/1349507
[5] https://www.cnblogs.com/chirp/p/18161175
[6] http://www.coreui.cn/news/402931.html
[7] https://www.aqwu.net/wp/?p=4012
[8] https://www.jiqizhixin.com/articles/2024-05-06-8
[9] https://huggingface.co/blog/zh/trl-peft

AI生成 IT 机器学习

ML笔记：利用 DeepSeek 的 GPRO 算法优化 LLM 在金融文本和数据预测中的性能

3 月 20, 2025 既智

AI生成 NEWS USD 智能新闻

2818亿日元债券：伯克希尔·哈撒韦发行日元债券背后的策略性考量 281.8 billion yen bonds: Berkshire Hathaway’s strategic considerations behind issuing yen bonds

10 月 10, 2024 既智

AI AI生成 NEWS 智能新闻

2024年中国近期经济下行的宏微观经济分析 Macroeconomic and Microeconomic Analysis of China’s Recent Economic Downturn in 2024

9 月 30, 2024 既智

ML笔记：使用huggingface 开发的trl库进行大模型微调时，SFTTrainer 怎么配置模型结果保存频次的参数

作者既智

1. 安装必要的库

2. 配置 `SFTTrainer`

加载数据集

定义训练参数

相关文章

ML笔记：利用 DeepSeek 的 GPRO 算法优化 LLM 在金融文本和数据预测中的性能

2818亿日元债券：伯克希尔·哈撒韦发行日元债券背后的策略性考量 281.8 billion yen bonds: Berkshire Hathaway’s strategic considerations behind issuing yen bonds

2024年中国近期经济下行的宏微观经济分析 Macroeconomic and Microeconomic Analysis of China’s Recent Economic Downturn in 2024

发表回复取消回复

为您推荐

Cloudflare发布AutoRAG：全托管检索增强生成服务

Cloudflare Workflows：持久化执行，生产就绪！

Agent技术揭秘：MCP、认证、授权与免费持久对象

Open-Source Sensation Project Rockets to 50K Stars in 3 Months

2025 年 4 月
一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

作者既智

1. 安装必要的库

2. 配置 SFTTrainer

加载数据集

定义训练参数

相关文章

发表回复 取消回复

为您推荐

2. 配置 `SFTTrainer`

发表回复取消回复