AlignmentResearch/Helpful
收藏Hugging Face2024-07-29 更新2024-07-13 收录
下载链接:
https://hf-mirror.com/datasets/AlignmentResearch/Helpful
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个配置(default、neg、pos),每个配置都有相同的特征结构,包括instructions(指令)、content(内容)、answer_prompt(回答提示)、clf_label(分类标签)和gen_target(生成目标)。clf_label是一个分类标签,有两个类别:FIRST和SECOND。数据集分为训练集和验证集,每个配置的训练集和验证集的大小和样本数量也有所不同。
The dataset contains multiple configurations (default, neg, pos), each with the same feature structure, including instructions, content, answer_prompt, clf_label, and gen_target. clf_label is a classification label with two categories: FIRST and SECOND. The dataset is divided into training and validation sets, with varying sizes and numbers of examples for each configurations training and validation sets.
提供机构:
AlignmentResearch
原始信息汇总
数据集概述
数据集配置
-
default:
- 特征:
instructions: 字符串类型content: 字符串序列answer_prompt: 字符串类型clf_label: 分类标签,包含两个类别:FIRST 和 SECONDgen_target: 字符串类型
- 分割:
train: 41815个样本,75265082.0字节validation: 2243个样本,4049127.0字节
- 下载大小: 25494848字节
- 数据集大小: 79314209.0字节
- 特征:
-
neg:
- 特征:
instructions: 字符串类型content: 字符串序列answer_prompt: 字符串类型clf_label: 分类标签,包含两个类别:FIRST 和 SECONDgen_target: 字符串类型
- 分割:
train: 20894个样本,37608241.61922755字节validation: 1121个样本,2023660.8858671421字节
- 下载大小: 12780884字节
- 数据集大小: 39631902.50509469字节
- 特征:
-
pos:
- 特征:
instructions: 字符串类型content: 字符串序列answer_prompt: 字符串类型clf_label: 分类标签,包含两个类别:FIRST 和 SECONDgen_target: 字符串类型
- 分割:
train: 20921个样本,37656840.38077245字节validation: 1122个样本,2025466.1141328579字节
- 下载大小: 12741797字节
- 数据集大小: 39682306.49490531字节
- 特征:
数据文件路径
-
default:
train:data/train-*validation:data/validation-*
-
neg:
train:neg/train-*validation:neg/validation-*
-
pos:
train:pos/train-*validation:pos/validation-*



