trace_10001_20000_dpo
收藏Hugging Face2026-03-19 更新2026-03-20 收录
下载链接:
https://huggingface.co/datasets/jeff4000/trace_10001_20000_dpo
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含2,923个训练样本,总大小为37,699,252字节。每个样本包含以下字段:任务ID(task_id,int64类型)、种子(seed,int64类型)、指令(instruction,字符串类型)、输入(input,字符串类型)、接受答案(accepted,字符串类型)、拒绝答案(rejected,字符串类型)、接受答案得分(accepted_score,float64类型)和拒绝答案得分(rejected_score,float64类型)。数据集仅包含训练集(train split),下载大小为15,423,253字节。默认配置的数据文件路径为'data/train-*'。该数据集适用于指令遵循、答案评分等自然语言处理任务。
创建时间:
2026-03-18



