muscle-memory/preference_dataset
收藏Hugging Face2024-07-30 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/muscle-memory/preference_dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含四个主要特征:指令(instruction)、选择的回答(chosen)、拒绝的回答(rejected)和来源(source)。数据集仅包含一个训练集分割,共有1,153,937个样本,总大小为2,401,857,952字节,下载大小为1,413,270,577字节。数据集的配置文件为默认配置,数据文件路径为data/train-*。
The dataset contains four main features: instruction, chosen (selected response), rejected (rejected response), and source. The dataset includes only a training split with 1,153,937 examples, totaling 2,401,857,952 bytes in size and a download size of 1,413,270,577 bytes. The datasets configuration is set to default, with data files located at data/train-*.
提供机构:
muscle-memory
原始信息汇总
数据集概述
数据集信息
-
特征:
- instruction: 数据类型为字符串。
- chosen: 数据类型为字符串。
- rejected: 数据类型为字符串。
-
分割:
- train: 包含63335个样本,占用200758762字节。
-
下载大小: 108414233字节
-
数据集大小: 200758762字节
配置
- 配置名称: default
- 数据文件:
- train: 路径为
data/train-*。
- train: 路径为
- 数据文件:



