D-ExpTracker__mixed_skills__v1
收藏数据集概述:TAUR-dev/D-ExpTracker__mixed_skills__v1
数据集描述
- 实验描述:SFT with validation tracking: mixed_skills
- 开始时间:2025-07-31T01:38:10.605075
- 数据集地址:https://huggingface.co/datasets/TAUR-dev/D-ExpTracker__mixed_skills__v1
数据集配置
数据集包含以下配置:
1. hyperparameters__sft
- 特征:
- 模型名称或路径、信任远程代码、阶段、是否训练、微调类型、deepspeed配置、数据集、模板、截断长度、最大样本数、覆盖缓存、预处理工作线程数、输出目录、日志步数、保存步数、绘制损失、覆盖输出目录、每设备训练批次大小、梯度累积步数、学习率、训练轮数、学习率调度器类型、预热比例、权重衰减、Adam beta1、Adam beta2、bf16、ddp超时、梯度检查点、仅保存模型、启用掩码范围、是否评估、评估策略、评估步数、评估数据集、每设备评估批次大小、计算自定义指标、报告对象、运行名称
- 数据量:
- 训练集:550字节,1个示例
- 下载大小:17348字节
- 数据集大小:550字节
2. logs__llamafactory_sft
- 特征:
- 时间戳、结束时间戳、阶段名称、阶段编号、级别、消息、标准输出内容、标准错误内容、实验名称、经过时间秒数、阶段完成
- 数据量:
- 训练集:1482525字节,3个示例
- 下载大小:344032字节
- 数据集大小:1482525字节
3. metadata
- 特征:
- 实验名称、开始时间、描述、基础组织、阶段编号、阶段类型、状态
- 数据量:
- 训练集:13013字节,45个示例
- 下载大小:5537字节
- 数据集大小:13013字节
4. training_data__sft
- 特征:
- 分割、示例索引、阶段名称、时间戳、对话(内容、角色)
- 数据量:
- 训练集:115994005字节,41338个示例
- 下载大小:40227275字节
- 数据集大小:115994005字节
5. training_data__sft_metadata
- 特征:
- 阶段名称、阶段编号、时间戳、原始数据集ID、数据集类型、用途、数据集信息(特征、示例数、分割)
- 数据量:
- 训练集:1208字节,4个示例
- 下载大小:5533字节
- 数据集大小:1208字节
使用方式
python from datasets import load_dataset
加载实验元数据
metadata = load_dataset(TAUR-dev/D-ExpTracker__mixed_skills__v1, experiment_metadata)
加载完整的训练数据集
sft_data = load_dataset(TAUR-dev/D-ExpTracker__mixed_skills__v1, training_data__sft) sft_metadata = load_dataset(TAUR-dev/D-ExpTracker__mixed_skills__v1, training_data__sft_metadata)
加载完整的配置
sft_hyperparams = load_dataset(TAUR-dev/D-ExpTracker__mixed_skills__v1, hyperparameters__sft) rl_hyperparams = load_dataset(TAUR-dev/D-ExpTracker__mixed_skills__v1, hyperparameters__rl)
加载阶段特定的日志
sft_logs = load_dataset(TAUR-dev/D-ExpTracker__mixed_skills__v1, logs__sft) rl_logs = load_dataset(TAUR-dev/D-ExpTracker__mixed_skills__v1, logs__rl)
加载带注释的评估结果
sft_eval_results = load_dataset(TAUR-dev/D-ExpTracker__mixed_skills__v1, evals_eval_sft) rl_eval_results = load_dataset(TAUR-dev/D-ExpTracker__mixed_skills__v1, evals_eval_rl)
相关模型
- sft模型:https://huggingface.co/TAUR-dev/M-mixed_skills-sft
注册信息
所有模型自动注册在SkillFactory模型注册表中,包含完整的训练配置、实验谱系、阶段特定元数据和结构化输入数据引用。




