Filippo/distilabel-intel-orca-dpo-pairs-filtered

Name: Filippo/distilabel-intel-orca-dpo-pairs-filtered
Creator: Filippo
Published: 2024-02-06 22:06:47
License: 暂无描述

Hugging Face2024-02-06 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/Filippo/distilabel-intel-orca-dpo-pairs-filtered

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多个特性，如系统、问题、选择、拒绝、生成、顺序、标签模型、标签提示、原始标签响应、评分、理由、状态、原始选择、原始拒绝、选择分数和是否在gsm8k训练集中等。数据集分为训练集和测试集，训练集包含5329个例子，测试集包含593个例子。数据集的下载大小为36944857字节，数据集大小为74535298.26565053字节。

提供机构：

Filippo

原始信息汇总

数据集概述

数据集特征

system: 数据类型为字符串。
question: 数据类型为字符串。
chosen: 数据类型为字符串。
rejected: 数据类型为字符串。
generations: 数据类型为字符串序列。
order: 数据类型为字符串序列。
labelling_model: 数据类型为字符串。
labelling_prompt: 包含以下字段：
- content: 数据类型为字符串。
- role: 数据类型为字符串。
raw_labelling_response: 数据类型为字符串。
rating: 数据类型为浮点数序列。
rationale: 数据类型为字符串。
status: 数据类型为字符串。
original_chosen: 数据类型为字符串。
original_rejected: 数据类型为字符串。
chosen_score: 数据类型为浮点数。
in_gsm8k_train: 数据类型为布尔值。

数据集分割

train: 包含5329个样本，总大小为67071699.50314955字节。
test: 包含593个样本，总大小为7463598.7625009725字节。

数据集大小

下载大小: 36944857字节。
数据集大小: 74535298.26565053字节。

配置

default: 包含以下数据文件：
- train: 路径为data/train-*。
- test: 路径为data/test-*。