unsloth-jobs
收藏数据集概述
数据集基本信息
- 数据集名称: Unsloth Training Scripts for HF Jobs
- 数据集地址: https://huggingface.co/datasets/uv-scripts/unsloth-jobs
- 标签: uv-script, unsloth, training, hf-jobs, vlm, fine-tuning
- 主要用途: 提供用于在HF Jobs(按需云GPU)上使用Unsloth微调LLM和VLM的UV脚本。
数据集内容
- 脚本类型: 包含用于视觉语言模型(VLM)微调和持续预训练的Python脚本。
- 核心脚本:
sft-qwen3-vl.py: 基于Qwen3-VL-8B模型进行VLM微调。sft-gemma3-vlm.py: 基于Gemma 3 4B模型进行VLM微调(较小模型)。continued-pretraining.py: 基于Qwen3-0.6B模型进行领域适应(持续预训练)。
数据格式要求
VLM微调
- 必需列:
images和messages。 images: PIL.Image对象的列表。messages: 遵循特定角色和内容结构的消息列表。- 示例数据集: https://huggingface.co/datasets/davanstrien/iconclass-vlm-sft
持续预训练
- 必需列: 包含文本的列(默认列名为
text)。 - 可使用
--text-column参数指定其他列名。
使用前提
- 拥有Hugging Face账户及访问令牌。
- 已安装HF CLI。
- 在Hub上拥有符合格式要求的数据集。
使用方法
查看脚本选项
bash uv run https://huggingface.co/datasets/uv-scripts/unsloth-jobs/raw/main/sft-qwen3-vl.py --help
VLM微调示例命令
bash hf jobs uv run https://huggingface.co/datasets/uv-scripts/unsloth-jobs/raw/main/sft-qwen3-vl.py --flavor a100-large --secrets HF_TOKEN --timeout 4h -- --dataset your-username/your-vlm-dataset --num-epochs 1 --eval-split 0.2 --output-repo your-username/my-vlm
持续预训练示例命令
bash hf jobs uv run https://huggingface.co/datasets/uv-scripts/unsloth-jobs/raw/main/continued-pretraining.py --flavor a100-large --secrets HF_TOKEN -- --dataset your-username/domain-corpus --text-column content --max-steps 1000 --output-repo your-username/domain-llm
带Trackio监控的示例命令
bash hf jobs uv run https://huggingface.co/datasets/uv-scripts/unsloth-jobs/raw/main/sft-qwen3-vl.py --flavor a100-large --secrets HF_TOKEN -- --dataset your-username/dataset --trackio-space your-username/trackio --output-repo your-username/my-model
常用参数
| 参数 | 描述 | 默认值 |
|---|---|---|
--dataset |
Hugging Face数据集ID | 必需 |
--output-repo |
保存训练后模型的位置 | 必需 |
--max-steps |
训练步数 | 500 |
--num-epochs |
训练轮数(替代步数) | - |
--eval-split |
用于评估的数据比例(如0.2) | 0(禁用) |
--batch-size |
每个设备的批量大小 | 2 |
--learning-rate |
学习率 | 2e-4 |
--trackio-space |
用于实时监控的HF Space | - |
使用建议
- 使用
--max-steps 10在全量运行前验证流程。 - 使用
--eval-split 0.2有助于检测过拟合。 - A100-large规格费用约为每小时4美元。
- 对于大型数据集,可添加
--streaming参数。
相关链接
- HF Jobs快速入门: https://huggingface.co/docs/hub/jobs-quickstart
- Unsloth文档: https://docs.unsloth.ai/
- UV脚本指南: https://docs.astral.sh/uv/guides/scripts/




