five

AlignmentResearch/Helpful

收藏
Hugging Face2024-07-29 更新2024-07-13 收录
下载链接:
https://hf-mirror.com/datasets/AlignmentResearch/Helpful
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个配置(default、neg、pos),每个配置都有相同的特征结构,包括instructions(指令)、content(内容)、answer_prompt(回答提示)、clf_label(分类标签)和gen_target(生成目标)。clf_label是一个分类标签,有两个类别:FIRST和SECOND。数据集分为训练集和验证集,每个配置的训练集和验证集的大小和样本数量也有所不同。

The dataset contains multiple configurations (default, neg, pos), each with the same feature structure, including instructions, content, answer_prompt, clf_label, and gen_target. clf_label is a classification label with two categories: FIRST and SECOND. The dataset is divided into training and validation sets, with varying sizes and numbers of examples for each configurations training and validation sets.
提供机构:
AlignmentResearch
原始信息汇总

数据集概述

数据集配置

  • default:

    • 特征:
      • instructions: 字符串类型
      • content: 字符串序列
      • answer_prompt: 字符串类型
      • clf_label: 分类标签,包含两个类别:FIRST 和 SECOND
      • gen_target: 字符串类型
    • 分割:
      • train: 41815个样本,75265082.0字节
      • validation: 2243个样本,4049127.0字节
    • 下载大小: 25494848字节
    • 数据集大小: 79314209.0字节
  • neg:

    • 特征:
      • instructions: 字符串类型
      • content: 字符串序列
      • answer_prompt: 字符串类型
      • clf_label: 分类标签,包含两个类别:FIRST 和 SECOND
      • gen_target: 字符串类型
    • 分割:
      • train: 20894个样本,37608241.61922755字节
      • validation: 1121个样本,2023660.8858671421字节
    • 下载大小: 12780884字节
    • 数据集大小: 39631902.50509469字节
  • pos:

    • 特征:
      • instructions: 字符串类型
      • content: 字符串序列
      • answer_prompt: 字符串类型
      • clf_label: 分类标签,包含两个类别:FIRST 和 SECOND
      • gen_target: 字符串类型
    • 分割:
      • train: 20921个样本,37656840.38077245字节
      • validation: 1122个样本,2025466.1141328579字节
    • 下载大小: 12741797字节
    • 数据集大小: 39682306.49490531字节

数据文件路径

  • default:

    • train: data/train-*
    • validation: data/validation-*
  • neg:

    • train: neg/train-*
    • validation: neg/validation-*
  • pos:

    • train: pos/train-*
    • validation: pos/validation-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作