five

AlignmentResearch/PasswordMatch-test

收藏
Hugging Face2024-07-26 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/AlignmentResearch/PasswordMatch-test
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: - config_name: default features: - name: instructions dtype: string - name: content sequence: string - name: answer_prompt dtype: string - name: clf_label dtype: class_label: names: '0': ' DENIED' '1': ' GRANTED' - name: gen_target dtype: string splits: - name: train num_bytes: 9924270.0 num_examples: 25000 - name: validation num_bytes: 9923464.0 num_examples: 25000 download_size: 1210677 dataset_size: 19847734.0 - config_name: neg features: - name: instructions dtype: string - name: content sequence: string - name: answer_prompt dtype: string - name: clf_label dtype: class_label: names: '0': ' DENIED' '1': ' GRANTED' - name: gen_target dtype: string splits: - name: train num_bytes: 4962135.0 num_examples: 12500 - name: validation num_bytes: 4961732.0 num_examples: 12500 download_size: 652585 dataset_size: 9923867.0 - config_name: pos features: - name: instructions dtype: string - name: content sequence: string - name: answer_prompt dtype: string - name: clf_label dtype: class_label: names: '0': ' DENIED' '1': ' GRANTED' - name: gen_target dtype: string splits: - name: train num_bytes: 4962135.0 num_examples: 12500 - name: validation num_bytes: 4961732.0 num_examples: 12500 download_size: 543869 dataset_size: 9923867.0 configs: - config_name: default data_files: - split: train path: data/train-* - split: validation path: data/validation-* - config_name: neg data_files: - split: train path: neg/train-* - split: validation path: neg/validation-* - config_name: pos data_files: - split: train path: pos/train-* - split: validation path: pos/validation-* ---
提供机构:
AlignmentResearch
原始信息汇总

数据集概述

配置名称:default

  • 特征信息:

    • instructions: 数据类型为字符串
    • content: 数据类型为字符串序列
    • answer_prompt: 数据类型为字符串
    • clf_label: 数据类型为int64
    • gen_target: 数据类型为字符串
  • 数据分割:

    • 训练集:25000个样本,占用9274270.0字节
    • 验证集:25000个样本,占用9273464.0字节
  • 数据集大小: 18547734.0字节

  • 下载大小: 1193678字节

配置名称:neg

  • 特征信息:

    • instructions: 数据类型为字符串
    • content: 数据类型为字符串序列
    • answer_prompt: 数据类型为字符串
    • clf_label: 数据类型为int64
    • gen_target: 数据类型为字符串
  • 数据分割:

    • 训练集:12500个样本,占用4637135.0字节
    • 验证集:12500个样本,占用4636732.0字节
  • 数据集大小: 9273867.0字节

  • 下载大小: 649234字节

配置名称:pos

  • 特征信息:

    • instructions: 数据类型为字符串
    • content: 数据类型为字符串序列
    • answer_prompt: 数据类型为字符串
    • clf_label: 数据类型为int64
    • gen_target: 数据类型为字符串
  • 数据分割:

    • 训练集:12500个样本,占用4637135.0字节
    • 验证集:12500个样本,占用4636732.0字节
  • 数据集大小: 9273867.0字节

  • 下载大小: 543384字节

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作