vwxyzjn/cai-conversation-dev
收藏Hugging Face2024-01-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/vwxyzjn/cai-conversation-dev
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: index
dtype: int64
- name: prompt
dtype: string
- name: init_prompt
struct:
- name: content
dtype: string
- name: role
dtype: string
- name: init_response
struct:
- name: content
dtype: string
- name: role
dtype: string
- name: critic_prompt
struct:
- name: content
dtype: string
- name: role
dtype: string
- name: critic_response
struct:
- name: content
dtype: string
- name: role
dtype: string
- name: revision_prompt
struct:
- name: content
dtype: string
- name: role
dtype: string
- name: revision_response
struct:
- name: content
dtype: string
- name: role
dtype: string
- name: messages
list:
- name: content
dtype: string
- name: role
dtype: string
- name: chosen
list:
- name: content
dtype: string
- name: role
dtype: string
- name: rejected
list:
- name: content
dtype: string
- name: role
dtype: string
splits:
- name: train_sft
num_bytes: 9128
num_examples: 4
- name: train_prefs
num_bytes: 10733
num_examples: 4
- name: test_sft
num_bytes: 15069
num_examples: 4
- name: test_prefs
num_bytes: 11987
num_examples: 4
download_size: 126881
dataset_size: 46917
configs:
- config_name: default
data_files:
- split: train_sft
path: data/train_sft-*
- split: train_prefs
path: data/train_prefs-*
- split: test_sft
path: data/test_sft-*
- split: test_prefs
path: data/test_prefs-*
---
# Dataset Card for "cai-conversation-dev"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
vwxyzjn
原始信息汇总
数据集概述
数据集特征
- index: 数据索引,数据类型为
int64。 - prompt: 提示信息,数据类型为
string。 - init_prompt: 初始提示信息,包含以下结构:
- content: 内容,数据类型为
string。 - role: 角色,数据类型为
string。
- content: 内容,数据类型为
- init_response: 初始响应信息,包含以下结构:
- content: 内容,数据类型为
string。 - role: 角色,数据类型为
string。
- content: 内容,数据类型为
- critic_prompt: 批评提示信息,包含以下结构:
- content: 内容,数据类型为
string。 - role: 角色,数据类型为
string。
- content: 内容,数据类型为
- critic_response: 批评响应信息,包含以下结构:
- content: 内容,数据类型为
string。 - role: 角色,数据类型为
string。
- content: 内容,数据类型为
- revision_prompt: 修订提示信息,包含以下结构:
- content: 内容,数据类型为
string。 - role: 角色,数据类型为
string。
- content: 内容,数据类型为
- revision_response: 修订响应信息,包含以下结构:
- content: 内容,数据类型为
string。 - role: 角色,数据类型为
string。
- content: 内容,数据类型为
- messages: 消息列表,包含以下结构:
- content: 内容,数据类型为
string。 - role: 角色,数据类型为
string。
- content: 内容,数据类型为
- chosen: 选定消息列表,包含以下结构:
- content: 内容,数据类型为
string。 - role: 角色,数据类型为
string。
- content: 内容,数据类型为
- rejected: 拒绝消息列表,包含以下结构:
- content: 内容,数据类型为
string。 - role: 角色,数据类型为
string。
- content: 内容,数据类型为
数据集分割
- train_sft: 训练集(SFT),包含 9128 字节,4 个样本。
- train_prefs: 训练集(PREFS),包含 10733 字节,4 个样本。
- test_sft: 测试集(SFT),包含 15069 字节,4 个样本。
- test_prefs: 测试集(PREFS),包含 11987 字节,4 个样本。
数据集大小
- 下载大小: 126881 字节。
- 数据集大小: 46917 字节。
配置
- default: 默认配置,包含以下数据文件路径:
- train_sft:
data/train_sft-* - train_prefs:
data/train_prefs-* - test_sft:
data/test_sft-* - test_prefs:
data/test_prefs-*
- train_sft:



