semiotic/spider_original
收藏Hugging Face2024-01-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/semiotic/spider_original
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: type
dtype: string
- name: question
dtype: string
- name: query
dtype: string
- name: db_id
dtype: string
- name: schema
dtype: string
splits:
- name: train
num_bytes: 9331918
num_examples: 7000
- name: val
num_bytes: 1041190
num_examples: 1034
- name: test
num_bytes: 2178834
num_examples: 2147
download_size: 644206
dataset_size: 12551942
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: val
path: data/val-*
- split: test
path: data/test-*
---
数据集信息:
特征字段:
- 字段名:type,数据类型:字符串
- 字段名:question,数据类型:字符串
- 字段名:query(查询语句),数据类型:字符串
- 字段名:db_id(数据库标识符),数据类型:字符串
- 字段名:schema(数据库模式),数据类型:字符串
数据划分:
- 划分名称:train,字节数:9331918,样本数量:7000
- 划分名称:val,字节数:1041190,样本数量:1034
- 划分名称:test,字节数:2178834,样本数量:2147
下载大小:644206
数据集总大小:12551942
配置项:
- 配置名称:default
数据文件:
- 对应划分:train,数据路径:data/train-*
- 对应划分:val,数据路径:data/val-*
- 对应划分:test,数据路径:data/test-*
提供机构:
semiotic
原始信息汇总
数据集概述
特征信息
- type: 数据类型为字符串。
- question: 数据类型为字符串。
- query: 数据类型为字符串。
- db_id: 数据类型为字符串。
- schema: 数据类型为字符串。
数据分割
- train: 包含7000个样本,占用9331918字节。
- val: 包含1034个样本,占用1041190字节。
- test: 包含2147个样本,占用2178834字节。
数据集大小
- 下载大小: 644206字节。
- 数据集总大小: 12551942字节。
配置信息
- default:
- train: 数据文件路径为
data/train-*。 - val: 数据文件路径为
data/val-*。 - test: 数据文件路径为
data/test-*。
- train: 数据文件路径为



