ShenaoZhang/0.001_idpo_4iters_ref_response

Name: ShenaoZhang/0.001_idpo_4iters_ref_response
Creator: ShenaoZhang
Published: 2024-04-06 17:21:02
License: 暂无描述

Hugging Face2024-04-06 更新2024-06-11 收录

下载链接：

https://hf-mirror.com/datasets/ShenaoZhang/0.001_idpo_4iters_ref_response

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: prompt dtype: string - name: prompt_id dtype: string - name: chosen list: - name: content dtype: string - name: role dtype: string - name: rejected list: - name: content dtype: string - name: role dtype: string - name: messages list: - name: content dtype: string - name: role dtype: string - name: score_chosen dtype: float64 - name: score_rejected dtype: float64 - name: reference_response dtype: string splits: - name: train_prefs_1 num_bytes: 125659628 num_examples: 15283 - name: test_prefs_1 num_bytes: 16380615 num_examples: 2000 - name: train_prefs_2 num_bytes: 127949761 num_examples: 15283 - name: test_prefs_2 num_bytes: 16634946 num_examples: 2000 - name: train_prefs_3 num_bytes: 128829232 num_examples: 15283 - name: test_prefs_3 num_bytes: 16759815 num_examples: 2000 download_size: 239309329 dataset_size: 432213997 configs: - config_name: default data_files: - split: train_prefs_1 path: data/train_prefs_1-* - split: test_prefs_1 path: data/test_prefs_1-* - split: train_prefs_2 path: data/train_prefs_2-* - split: test_prefs_2 path: data/test_prefs_2-* - split: train_prefs_3 path: data/train_prefs_3-* - split: test_prefs_3 path: data/test_prefs_3-* --- # Dataset Card for "0.001_idpo_4iters_ref_response" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

数据集信息：特征字段如下： 1. 提示词（prompt）：数据类型为字符串 2. 提示词ID（prompt_id）：数据类型为字符串 3. 优选响应（chosen）：列表类型，列表项包含两个子字段：`content`（内容，数据类型为字符串）与`role`（角色，数据类型为字符串） 4. 弃选响应（rejected）：列表类型，列表项包含两个子字段：`content`（内容，数据类型为字符串）与`role`（角色，数据类型为字符串） 5. 对话消息（messages）：列表类型，列表项包含两个子字段：`content`（内容，数据类型为字符串）与`role`（角色，数据类型为字符串） 6. 优选响应得分（score_chosen）：数据类型为float64 7. 弃选响应得分（score_rejected）：数据类型为float64 8. 参考响应（reference_response）：数据类型为字符串数据划分信息： - 划分名称：train_prefs_1，字节大小：125659628，样本数量：15283 - 划分名称：test_prefs_1，字节大小：16380615，样本数量：2000 - 划分名称：train_prefs_2，字节大小：127949761，样本数量：15283 - 划分名称：test_prefs_2，字节大小：16634946，样本数量：2000 - 划分名称：train_prefs_3，字节大小：128829232，样本数量：15283 - 划分名称：test_prefs_3，字节大小：16759815，样本数量：2000 整体下载大小：239309329，数据集总存储大小：432213997 配置项如下： - 配置名称：default，数据文件配置： - 划分：train_prefs_1，路径：data/train_prefs_1-* - 划分：test_prefs_1，路径：data/test_prefs_1-* - 划分：train_prefs_2，路径：data/train_prefs_2-* - 划分：test_prefs_2，路径：data/test_prefs_2-* - 划分：train_prefs_3，路径：data/train_prefs_3-* - 划分：test_prefs_3，路径：data/test_prefs_3-* --- # 「0.001_idpo_4iters_ref_response」数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

提供机构：

ShenaoZhang

原始信息汇总

数据集概述

数据集特征

prompt: 数据类型为字符串。
prompt_id: 数据类型为字符串。
chosen: 包含两个子特征
- content: 数据类型为字符串。
- role: 数据类型为字符串。
rejected: 包含两个子特征
- content: 数据类型为字符串。
- role: 数据类型为字符串。
messages: 包含两个子特征
- content: 数据类型为字符串。
- role: 数据类型为字符串。
score_chosen: 数据类型为float64。
score_rejected: 数据类型为float64。
reference_response: 数据类型为字符串。

数据集分割

train_prefs_1: 大小为125659628字节，包含15283个示例。
test_prefs_1: 大小为16380615字节，包含2000个示例。
train_prefs_2: 大小为127949761字节，包含15283个示例。
test_prefs_2: 大小为16634946字节，包含2000个示例。
train_prefs_3: 大小为128829232字节，包含15283个示例。
test_prefs_3: 大小为16759815字节，包含2000个示例。

数据集大小

下载大小: 239309329字节。
数据集总大小: 432213997字节。

配置信息

config_name: default
data_files:
- train_prefs_1: 路径为data/train_prefs_1-*
- test_prefs_1: 路径为data/test_prefs_1-*
- train_prefs_2: 路径为data/train_prefs_2-*
- test_prefs_2: 路径为data/test_prefs_2-*
- train_prefs_3: 路径为data/train_prefs_3-*
- test_prefs_3: 路径为data/test_prefs_3-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集