Hugging Face trl 微调库 SFT 代码阅读
SFT 代码阅读
Step 1. 模型和分词器初始化:
# 检查是否要对模型进行量化,减少显存占用
=
# 准备模型的参数:例如 attn_implementation 使用哪种注意力机制
=
# 加载 Hugging Face 预训练好的模型
=
# 加载 Hugging Face 预训练好的分词器
=
Step 2. 数据集加载:可以用 --dataset_name
加载一个标准数据集,也可以用 --datasets
提供更复杂的配置(例如混合多个不同的数据集)
# ...
=
=
Step 3. SFT 训练器初始化:
=
Step 4. 训练与保存:
# Train the model
# Save and push to Hub