AlignmentResearch/IMDB
收藏Hugging Face2024-07-29 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/AlignmentResearch/IMDB
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: default
features:
- name: clf_label
dtype:
class_label:
names:
'0': ' NEGATIVE'
'1': ' POSITIVE'
- name: instructions
dtype: string
- name: content
sequence: string
- name: answer_prompt
dtype: string
- name: proxy_clf_label
dtype:
class_label:
names:
'0': ' NEGATIVE'
'1': ' POSITIVE'
- name: gen_target
dtype: string
- name: proxy_gen_target
dtype: string
splits:
- name: train
num_bytes: 36534806.0
num_examples: 24365
- name: validation
num_bytes: 35973979.0
num_examples: 24401
download_size: 39238216
dataset_size: 72508785.0
- config_name: neg
features:
- name: clf_label
dtype:
class_label:
names:
'0': ' NEGATIVE'
'1': ' POSITIVE'
- name: instructions
dtype: string
- name: content
sequence: string
- name: answer_prompt
dtype: string
- name: proxy_clf_label
dtype:
class_label:
names:
'0': ' NEGATIVE'
'1': ' POSITIVE'
- name: gen_target
dtype: string
- name: proxy_gen_target
dtype: string
splits:
- name: train
num_bytes: 18293643.88261851
num_examples: 12200
- name: validation
num_bytes: 18017212.30109422
num_examples: 12221
download_size: 19465113
dataset_size: 36310856.18371273
- config_name: pos
features:
- name: clf_label
dtype:
class_label:
names:
'0': ' NEGATIVE'
'1': ' POSITIVE'
- name: instructions
dtype: string
- name: content
sequence: string
- name: answer_prompt
dtype: string
- name: proxy_clf_label
dtype:
class_label:
names:
'0': ' NEGATIVE'
'1': ' POSITIVE'
- name: gen_target
dtype: string
- name: proxy_gen_target
dtype: string
splits:
- name: train
num_bytes: 18241162.11738149
num_examples: 12165
- name: validation
num_bytes: 17956766.69890578
num_examples: 12180
download_size: 19669565
dataset_size: 36197928.81628727
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
- config_name: neg
data_files:
- split: train
path: neg/train-*
- split: validation
path: neg/validation-*
- config_name: pos
data_files:
- split: train
path: pos/train-*
- split: validation
path: pos/validation-*
---
提供机构:
AlignmentResearch
原始信息汇总
数据集概述
数据集配置
默认配置 (default)
- 特征:
clf_label: 分类标签,包含两个类别:NEGATIVE 和 POSITIVE。instructions: 字符串类型。content: 字符串序列。answer_prompt: 字符串类型。gen_target: 字符串类型。
- 分割:
train: 包含 24365 个样本,占用 36023141 字节。validation: 包含 24401 个样本,占用 35461558 字节。
- 下载大小: 39193116 字节。
- 数据集大小: 71484699 字节。
负向配置 (neg)
- 特征:
clf_label: 分类标签,包含两个类别:NEGATIVE 和 POSITIVE。instructions: 字符串类型。content: 字符串序列。answer_prompt: 字符串类型。gen_target: 字符串类型。
- 分割:
train: 包含 12200 个样本,占用 18037443.88261851 字节。validation: 包含 12221 个样本,占用 17760571.30109422 字节。
- 下载大小: 19448281 字节。
- 数据集大小: 35798015.18371273 字节。
正向配置 (pos)
- 特征:
clf_label: 分类标签,包含两个类别:NEGATIVE 和 POSITIVE。instructions: 字符串类型。content: 字符串序列。answer_prompt: 字符串类型。gen_target: 字符串类型。
- 分割:
train: 包含 12165 个样本,占用 17985697.11738149 字节。validation: 包含 12180 个样本,占用 17700986.69890578 字节。
- 下载大小: 19652733 字节。
- 数据集大小: 35686683.81628727 字节。
数据文件路径
默认配置 (default)
train:data/train-*validation:data/validation-*
负向配置 (neg)
train:neg/train-*validation:neg/validation-*
正向配置 (pos)
train:pos/train-*validation:pos/validation-*



