EleutherAI/quirky_capitals_raw
收藏Hugging Face2024-02-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/EleutherAI/quirky_capitals_raw
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如id、template_args(包含admin_name、character、city、country等子特征)、character、label、alice_label、bob_label、difficulty和difficulty_quantile。数据集分为train、validation和test三个部分,分别包含1023、2000和2000个样本。数据集的下载大小为221256字节,总大小为423164字节。
该数据集包含多个特征,如id、template_args(包含admin_name、character、city、country等子特征)、character、label、alice_label、bob_label、difficulty和difficulty_quantile。数据集分为train、validation和test三个部分,分别包含1023、2000和2000个样本。数据集的下载大小为221256字节,总大小为423164字节。
提供机构:
EleutherAI
原始信息汇总
数据集概述
数据特征
- id: 数据类型为字符串(string)。
- template_args: 结构化数据,包含以下字段:
- admin_name: 数据类型为字符串(string)。
- character: 数据类型为字符串(string)。
- city: 数据类型为字符串(string)。
- country: 数据类型为字符串(string)。
- character: 数据类型为字符串(string)。
- label: 数据类型为布尔值(bool)。
- alice_label: 数据类型为布尔值(bool)。
- bob_label: 数据类型为布尔值(bool)。
- difficulty: 数据类型为浮点数(float64)。
- difficulty_quantile: 数据类型为浮点数(float64)。
数据分割
- train: 包含1023个样本,占用86524字节。
- validation: 包含2000个样本,占用168155字节。
- test: 包含2000个样本,占用168485字节。
数据集大小
- 下载大小: 221256字节。
- 数据集大小: 423164字节。
配置
- default配置包含以下数据文件:
- train: 路径为
data/train-*。 - validation: 路径为
data/validation-*。 - test: 路径为
data/test-*。
- train: 路径为



