five

VictorDCh/spider-clean-text-to-sql

收藏
Hugging Face2024-04-26 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/VictorDCh/spider-clean-text-to-sql
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集主要用于文本到SQL生成任务,包含训练集、开发集和测试集。数据集的特征包括db_id、query、question和schema,分别表示数据库ID、SQL查询、自然语言问题和数据库模式。数据集的规模在1K到10K之间,适用于文本到SQL生成任务。
提供机构:
VictorDCh
原始信息汇总

数据集概述

语言

  • 英语(en)

数据规模

  • 1K<n<10K

任务类别

  • 文本到文本生成(text2text-generation)

数据集信息

特征

  • db_id: 字符串类型
  • query: 字符串类型
  • question: 字符串类型
  • schema: 字符串类型

数据分割

  • 训练集(train)
    • 字节数: 15299773
    • 样本数: 6016
  • 验证集(dev)
    • 字节数: 1142702
    • 样本数: 665
  • 测试集(test)
    • 字节数: 3542050
    • 样本数: 1929

数据大小

  • 下载大小: 585756 字节
  • 数据集大小: 19984525 字节

配置

  • 默认配置(default)
    • 数据文件路径:
      • 训练集: data/train-*
      • 验证集: data/dev-*
      • 测试集: data/test-*

标签

  • text-to-sql
  • spider
  • sql
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作