alvarobartt/Anthropic_HH_Golden_Extended
收藏Hugging Face2023-12-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/alvarobartt/Anthropic_HH_Golden_Extended
下载链接
链接失效反馈官方服务:
资源简介:
---
tags:
- not-for-all-audiences
dataset_info:
features:
- name: prompt_id
dtype: string
- name: prompt
dtype: string
- name: chosen
list:
- name: content
dtype: string
- name: role
dtype: string
- name: rejected
list:
- name: content
dtype: string
- name: role
dtype: string
splits:
- name: train
num_bytes: 128690951
num_examples: 85074
- name: test
num_bytes: 7201288
num_examples: 4624
download_size: 44628148
dataset_size: 135892239
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
license: apache-2.0
task_categories:
- conversational
language:
- en
size_categories:
- 10K<n<100K
---
提供机构:
alvarobartt
原始信息汇总
数据集概述
数据集特征
- prompt_id: 数据类型为字符串。
- prompt: 数据类型为字符串。
- chosen: 包含以下子特征:
- content: 数据类型为字符串。
- role: 数据类型为字符串。
- rejected: 包含以下子特征:
- content: 数据类型为字符串。
- role: 数据类型为字符串。
数据集划分
- train: 包含85074个样本,占用128690951字节。
- test: 包含4624个样本,占用7201288字节。
数据集大小
- 下载大小: 44628148字节。
- 数据集大小: 135892239字节。
配置
- 默认配置: 包含以下数据文件:
- train: 路径为
data/train-*。 - test: 路径为
data/test-*。
- train: 路径为
许可证
- apache-2.0
任务类别
- conversational
语言
- en
大小类别
- 10K<n<100K



