five

NESPED-GEN/spider

收藏
Hugging Face2025-02-11 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/NESPED-GEN/spider
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含与数据库查询和自然语言处理相关的多个字段,如数据库ID(db_id)、模式(schema)、英文问题(question_en)、查询语句(query)、答案(answer)等。数据集被分割为训练集(train)、开发集(dev)、测试集(test)、Spider训练集(train_spider)和其他训练集(train_others),每个部分都有相应的文件大小和示例数量。

This dataset contains multiple fields related to database queries and natural language processing, such as database ID (db_id), schema, English question (question_en), query, answer, etc. The dataset is divided into training set (train), development set (dev), test set (test), Spider training set (train_spider), and other training sets (train_others), each with corresponding file sizes and number of examples.
提供机构:
NESPED-GEN
原始信息汇总

数据集概述

数据集特征

  • db_id: 数据类型 - 字符串
  • schema: 数据类型 - 字符串
  • schemaComEx: 数据类型 - 字符串
  • query: 数据类型 - 字符串
  • answer: 数据类型 - 字符串
  • complexity: 数据类型 - 字符串
  • distinct: 数据类型 - 布尔值
  • like: 数据类型 - 布尔值
  • between: 数据类型 - 布尔值
  • order_by: 数据类型 - 布尔值
  • limit: 数据类型 - 布尔值
  • grouby_by: 数据类型 - 布尔值
  • having: 数据类型 - 布尔值
  • single_join: 数据类型 - 布尔值
  • multiple_join: 数据类型 - 布尔值
  • multiple_select: 数据类型 - 布尔值
  • intersect: 数据类型 - 布尔值
  • except: 数据类型 - 布尔值
  • union: 数据类型 - 布尔值
  • sql_example_80: 数据类型 - 字符串
  • sql_example_85: 数据类型 - 字符串
  • sql_example_90: 数据类型 - 字符串
  • sql_example_95: 数据类型 - 字符串
  • question_pt: 数据类型 - 字符串
  • question_en: 数据类型 - 字符串
  • index_level_0: 数据类型 - 整数

数据集分割

  • 训练集: 大小 - 44193963 字节, 示例数 - 7944
  • 测试集: 大小 - 14568959 字节, 示例数 - 1867

数据集大小

  • 下载大小: 13751068 字节
  • 数据集总大小: 58762922 字节

配置文件

  • 默认配置:
    • 训练数据路径: data/train-*
    • 测试数据路径: data/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作