five

redwoodresearch/wmdp-cyber-deduped

收藏
Hugging Face2024-03-14 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/redwoodresearch/wmdp-cyber-deduped
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个分割,每个分割包含多个示例。每个示例由一个问题、多个选项和一个答案组成。问题的数据类型为字符串,选项是一个字符串序列,答案的数据类型为整数。数据集的总下载大小为139755字节,总数据集大小为194470字节。

该数据集包含多个分割,每个分割包含多个示例。每个示例由一个问题、多个选项和一个答案组成。问题的数据类型为字符串,选项是一个字符串序列,答案的数据类型为整数。数据集的总下载大小为139755字节,总数据集大小为194470字节。
提供机构:
redwoodresearch
原始信息汇总

数据集概述

数据集特征

  • question:字符串类型
  • choices:字符串序列
  • answer:整数类型(int64)

数据集分割

  • dev:5个样本,占用1772字节
  • split_0:125个样本,占用36846字节
  • split_1:125个样本,占用39721字节
  • split_2:125个样本,占用39199字节
  • split_3:125个样本,占用37203字节
  • split_4:125个样本,占用39729字节

数据集大小

  • 下载大小:139755字节
  • 数据集大小:194470字节

配置文件

  • 默认配置:包含所有分割的数据文件路径
    • dev:路径为data/dev-*
    • split_0:路径为data/split_0-*
    • split_1:路径为data/split_1-*
    • split_2:路径为data/split_2-*
    • split_3:路径为data/split_3-*
    • split_4:路径为data/split_4-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作