Jason-Chen/DPO-En-TW-20k
收藏Hugging Face2024-04-27 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Jason-Chen/DPO-En-TW-20k
下载链接
链接失效反馈官方服务:
资源简介:
---
license: apache-2.0
dataset_info:
- config_name: en
features:
- name: system
dtype: string
- name: history
list:
list: string
- name: prompt
dtype: string
- name: answer
list: string
- name: en
struct:
- name: answer
sequence: string
- name: history
sequence:
sequence: string
- name: prompt
dtype: string
- name: system
dtype: string
splits:
- name: train
num_bytes: 95280806
num_examples: 10000
download_size: 50778351
dataset_size: 95280806
- config_name: zh
features:
- name: system
dtype: string
- name: history
list:
list: string
- name: prompt
dtype: string
- name: answer
list: string
- name: zh
struct:
- name: answer
sequence: string
- name: history
sequence: 'null'
- name: prompt
dtype: string
- name: system
dtype: string
splits:
- name: train
num_bytes: 52611978
num_examples: 10000
download_size: 31324157
dataset_size: 52611978
configs:
- config_name: en
data_files:
- split: train
path: en/train-*
- config_name: zh
data_files:
- split: train
path: zh/train-*
---
提供机构:
Jason-Chen
原始信息汇总
数据集概述
数据集配置
英文配置 (en)
- 特征:
system: 数据类型为字符串。history: 列表类型,内部列表为字符串。prompt: 数据类型为字符串。answer: 列表类型,内部为字符串。en: 结构体,包含以下序列:answer: 序列类型,内容为字符串。history: 序列类型,内部序列内容为字符串。prompt: 数据类型为字符串。system: 数据类型为字符串。
- 分割:
train: 大小为95,280,806字节,包含10,000个示例。
- 下载大小: 50,778,351字节。
- 数据集大小: 95,280,806字节。
中文配置 (zh)
- 特征:
system: 数据类型为字符串。history: 列表类型,内部列表为字符串。prompt: 数据类型为字符串。answer: 列表类型,内部为字符串。zh: 结构体,包含以下序列:answer: 序列类型,内容为字符串。history: 序列类型,值为null。prompt: 数据类型为字符串。system: 数据类型为字符串。
- 分割:
train: 大小为52,611,978字节,包含10,000个示例。
- 下载大小: 31,324,157字节。
- 数据集大小: 52,611,978字节。
数据文件
- 英文配置 (en):
train: 文件路径为en/train-*。
- 中文配置 (zh):
train: 文件路径为zh/train-*。



