NESPED-GEN/spider
收藏Hugging Face2025-02-11 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/NESPED-GEN/spider
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含与数据库查询和自然语言处理相关的多个字段,如数据库ID(db_id)、模式(schema)、英文问题(question_en)、查询语句(query)、答案(answer)等。数据集被分割为训练集(train)、开发集(dev)、测试集(test)、Spider训练集(train_spider)和其他训练集(train_others),每个部分都有相应的文件大小和示例数量。
This dataset contains multiple fields related to database queries and natural language processing, such as database ID (db_id), schema, English question (question_en), query, answer, etc. The dataset is divided into training set (train), development set (dev), test set (test), Spider training set (train_spider), and other training sets (train_others), each with corresponding file sizes and number of examples.
提供机构:
NESPED-GEN
原始信息汇总
数据集概述
数据集特征
- db_id: 数据类型 - 字符串
- schema: 数据类型 - 字符串
- schemaComEx: 数据类型 - 字符串
- query: 数据类型 - 字符串
- answer: 数据类型 - 字符串
- complexity: 数据类型 - 字符串
- distinct: 数据类型 - 布尔值
- like: 数据类型 - 布尔值
- between: 数据类型 - 布尔值
- order_by: 数据类型 - 布尔值
- limit: 数据类型 - 布尔值
- grouby_by: 数据类型 - 布尔值
- having: 数据类型 - 布尔值
- single_join: 数据类型 - 布尔值
- multiple_join: 数据类型 - 布尔值
- multiple_select: 数据类型 - 布尔值
- intersect: 数据类型 - 布尔值
- except: 数据类型 - 布尔值
- union: 数据类型 - 布尔值
- sql_example_80: 数据类型 - 字符串
- sql_example_85: 数据类型 - 字符串
- sql_example_90: 数据类型 - 字符串
- sql_example_95: 数据类型 - 字符串
- question_pt: 数据类型 - 字符串
- question_en: 数据类型 - 字符串
- index_level_0: 数据类型 - 整数
数据集分割
- 训练集: 大小 - 44193963 字节, 示例数 - 7944
- 测试集: 大小 - 14568959 字节, 示例数 - 1867
数据集大小
- 下载大小: 13751068 字节
- 数据集总大小: 58762922 字节
配置文件
- 默认配置:
- 训练数据路径:
data/train-* - 测试数据路径:
data/test-*
- 训练数据路径:



