OpenLeecher/double_take_dataset_dpo

Name: OpenLeecher/double_take_dataset_dpo
Creator: OpenLeecher
Published: 2024-06-01 01:26:26
License: 暂无描述

Hugging Face2024-06-01 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/OpenLeecher/double_take_dataset_dpo

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: system dtype: string - name: prompt dtype: string - name: chosen dtype: string - name: rejected dtype: string - name: id dtype: string - name: category dtype: string - name: subcategory dtype: string - name: validated dtype: string splits: - name: train num_bytes: 13951906 num_examples: 3915 - name: test num_bytes: 818192 num_examples: 235 download_size: 7404437 dataset_size: 14770098 configs: - config_name: default data_files: - split: train path: data/train-* - split: test path: data/test-* ---

The dataset includes multiple features such as system, prompt, chosen, rejected, etc., with each feature being of string data type. The dataset is divided into a training set and a test set, containing 3915 and 235 samples respectively. The configuration name of the dataset is default, and the data file paths correspond to the training and test sets.

提供机构：

OpenLeecher

原始信息汇总

数据集概述

数据集特征

system: 数据类型为字符串
prompt: 数据类型为字符串
chosen: 数据类型为字符串
rejected: 数据类型为字符串
id: 数据类型为字符串
category: 数据类型为字符串
subcategory: 数据类型为字符串
validated: 数据类型为字符串

数据集分割

训练集: 包含3915个样本，总大小为13951906字节
测试集: 包含235个样本，总大小为818192字节

数据集大小

下载大小: 7404437字节
数据集总大小: 14770098字节

数据文件配置

默认配置:
- 训练集文件路径: data/train-*
- 测试集文件路径: data/test-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集