cstr/dpo-mix-7k-simplified-de-v2
收藏Hugging Face2024-06-26 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/cstr/dpo-mix-7k-simplified-de-v2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个字段,如prompt、chosen、rejected等,每个字段都是一个列表,列表中包含content和role两个子字段,数据类型均为string。数据集分为train和test两个分割,分别包含4个示例,并提供了每个分割的文件路径。
该数据集包含多个字段,如prompt、chosen、rejected等,每个字段都是一个列表,列表中包含content和role两个子字段,数据类型均为string。数据集分为train和test两个分割,分别包含4个示例,并提供了每个分割的文件路径。
提供机构:
cstr
原始信息汇总
数据集概述
数据集结构
- features:
- dataset:
- 类型: string
- prompt:
- content:
- 类型: string
- role:
- 类型: string
- content:
- chosen:
- content:
- 类型: string
- role:
- 类型: string
- content:
- rejected:
- content:
- 类型: string
- role:
- 类型: string
- content:
- translated_prompt:
- content:
- 类型: string
- role:
- 类型: string
- content:
- translated_chosen:
- content:
- 类型: string
- role:
- 类型: string
- content:
- translated_rejected:
- content:
- 类型: string
- role:
- 类型: string
- content:
- dataset:
数据集划分
- splits:
- train:
- 字节数: 41438
- 样本数: 4
- test:
- 字节数: 20219
- 样本数: 4
- train:
数据集大小
- download_size: 107248
- dataset_size: 61657
配置
- configs:
- config_name: default
- data_files:
- split: train
- path: data/train-*
- split: test
- path: data/test-*
- split: train
- data_files:
- config_name: default



