arcee-ai/cleaned-mlabonne-distilabel-intel-orca-dpo-pairs
收藏Hugging Face2024-06-18 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/arcee-ai/cleaned-mlabonne-distilabel-intel-orca-dpo-pairs
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,包括系统、问题、选择的回答、拒绝的回答、ID和来源。选择的回答和拒绝的回答都是列表形式,每个列表包含内容和角色两个字段。数据集分为训练集,包含5922个样本,总大小为26807624字节。下载大小为13853112字节。
The dataset contains multiple features, including system, question, chosen response, rejected response, ID, and source. Both chosen and rejected responses are in list format, each containing content and role fields. The dataset is divided into a training set with 5922 samples, totaling 26807624 bytes. The download size is 13853112 bytes.
提供机构:
arcee-ai
原始信息汇总
数据集概述
数据集信息
特征
- system: 类型为字符串。
- question: 类型为字符串。
- chosen: 包含以下子特征:
- content: 类型为字符串。
- role: 类型为字符串。
- rejected: 包含以下子特征:
- content: 类型为字符串。
- role: 类型为字符串。
- id: 类型为字符串。
- source: 类型为字符串。
数据分割
- train: 包含5922个样本,占用26807624字节。
数据集大小
- 下载大小: 13853112字节。
- 数据集大小: 26807624字节。
配置
- default: 包含训练数据文件,路径为
data/train-*。



