Katayoon/VPO-Zephyr-7B-dataset
收藏Hugging Face2024-07-19 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Katayoon/VPO-Zephyr-7B-dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集可能用于对话生成或偏好学习任务,包含prompt、prompt_id、messages、reference_response、chosen和rejected等特征。数据集被分为多个训练和测试集,每个分割都有相应的字节数和示例数。
This dataset is likely used for dialogue generation or preference learning tasks, containing features such as prompt, prompt_id, messages, reference_response, chosen, and rejected. The dataset is divided into multiple training and test sets, each with corresponding byte sizes and example counts.
提供机构:
Katayoon
原始信息汇总
VPO-Zephyr-7B-dataset
数据集概述
- 数据集名称: VPO-Zephyr-7B-dataset
- 数据集大小: 487,344,290 字节
- 下载大小: 265,509,163 字节
数据集特征
- prompt: 字符串类型
- prompt_id: 字符串类型
- messages: 列表类型,包含以下字段:
- content: 字符串类型
- role: 字符串类型
- reference_response: 字符串类型
- chosen: 列表类型,包含以下字段:
- content: 字符串类型
- role: 字符串类型
- rejected: 列表类型,包含以下字段:
- content: 字符串类型
- role: 字符串类型
数据集分割
- test_prefs_1:
- 样本数量: 2,000
- 字节数: 18,856,621
- train_prefs_1:
- 样本数量: 15,283
- 字节数: 144,245,192
- test_prefs_2:
- 样本数量: 2,000
- 字节数: 18,522,429
- train_prefs_2:
- 样本数量: 15,283
- 字节数: 141,889,934
- test_prefs_3:
- 样本数量: 2,000
- 字节数: 18,884,076
- train_prefs_3:
- 样本数量: 15,283
- 字节数: 144,946,038
配置
- 配置名称: default
- 数据文件路径:
- test_prefs_1: data/test_prefs_1-*
- train_prefs_1: data/train_prefs_1-*
- test_prefs_2: data/test_prefs_2-*
- train_prefs_2: data/train_prefs_2-*
- test_prefs_3: data/test_prefs_3-*
- train_prefs_3: data/train_prefs_3-*
- 数据文件路径:



