jeggers/bigbench_small
收藏Hugging Face2024-03-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/jeggers/bigbench_small
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test_all
path: data/test_all-*
- split: test_small
path: data/test_small-*
- split: test_tiny
path: data/test_tiny-*
dataset_info:
features:
- name: inputs
dtype: string
- name: targets
sequence: string
- name: multiple_choice_targets
sequence: string
- name: task
dtype: string
- name: extra_instruction
dtype: string
splits:
- name: train
num_bytes: 11378409
num_examples: 12783
- name: test_all
num_bytes: 9776359
num_examples: 9534
- name: test_small
num_bytes: 1258290
num_examples: 1540
- name: test_tiny
num_bytes: 250827
num_examples: 308
download_size: 9350136
dataset_size: 22663885
---
# Dataset Card for "bigbench_small"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
配置项:
- 配置名称:default
数据文件:
- 数据集拆分:train,路径:data/train-*
- 数据集拆分:test_all,路径:data/test_all-*
- 数据集拆分:test_small,路径:data/test_small-*
- 数据集拆分:test_tiny,路径:data/test_tiny-*
数据集信息:
特征:
- 特征名称:输入(inputs),数据类型:字符串
- 特征名称:目标(targets),数据类型:字符串序列
- 特征名称:多项选择目标(multiple_choice_targets),数据类型:字符串序列
- 特征名称:任务(task),数据类型:字符串
- 特征名称:额外指令(extra_instruction),数据类型:字符串
数据集拆分:
- 名称:train,字节数:11378409,样本数量:12783
- 名称:test_all,字节数:9776359,样本数量:9534
- 名称:test_small,字节数:1258290,样本数量:1540
- 名称:test_tiny,字节数:250827,样本数量:308
下载总大小:9350136
数据集总大小:22663885
---
# 「bigbench_small」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
jeggers
原始信息汇总
数据集概述
数据集配置
- 默认配置 (
default)- 数据文件路径:
- 训练集 (
train):data/train-* - 完整测试集 (
test_all):data/test_all-* - 小规模测试集 (
test_small):data/test_small-* - 微小规模测试集 (
test_tiny):data/test_tiny-*
- 训练集 (
- 数据文件路径:
数据集信息
-
特征字段:
inputs: 字符串类型targets: 字符串序列multiple_choice_targets: 字符串序列task: 字符串类型extra_instruction: 字符串类型
-
数据分割:
- 训练集 (
train):- 字节数: 11,378,409
- 样本数: 12,783
- 完整测试集 (
test_all):- 字节数: 9,776,359
- 样本数: 9,534
- 小规模测试集 (
test_small):- 字节数: 1,258,290
- 样本数: 1,540
- 微小规模测试集 (
test_tiny):- 字节数: 250,827
- 样本数: 308
- 训练集 (
-
数据集大小:
- 下载大小: 9,350,136 字节
- 数据集总大小: 22,663,885 字节



