EleutherAI/quirky_subtraction_raw
收藏Hugging Face2024-02-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/EleutherAI/quirky_subtraction_raw
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如id、template_args、character、label、alice_label、bob_label、difficulty和difficulty_quantile。其中,template_args是一个结构体,包含character、op1、op2和result四个子特征。数据集分为train、validation和test三个部分,分别包含384000、8000和8000个样本。数据集的下载大小为13488986字节,总大小为27350000字节。
该数据集包含多个特征,如id、template_args、character、label、alice_label、bob_label、difficulty和difficulty_quantile。其中,template_args是一个结构体,包含character、op1、op2和result四个子特征。数据集分为train、validation和test三个部分,分别包含384000、8000和8000个样本。数据集的下载大小为13488986字节,总大小为27350000字节。
提供机构:
EleutherAI
原始信息汇总
数据集概述
数据集特征
- id: 类型为字符串。
- template_args: 结构化数据,包含以下字段:
- character: 类型为字符串。
- op1: 类型为int64。
- op2: 类型为int64。
- result: 类型为int64。
- character: 类型为字符串。
- label: 类型为布尔值。
- alice_label: 类型为布尔值。
- bob_label: 类型为布尔值。
- difficulty: 类型为int64。
- difficulty_quantile: 类型为float64。
数据集分割
- train: 包含384000个样本,总字节数为26256000。
- validation: 包含8000个样本,总字节数为547000。
- test: 包含8000个样本,总字节数为547000。
数据集大小
- 下载大小: 13488986字节。
- 数据集大小: 27350000字节。
配置
- default: 包含以下数据文件路径:
- train:
data/train-* - validation:
data/validation-* - test:
data/test-*
- train:



