VictorDCh/spider-clean-text-to-sql
收藏Hugging Face2024-04-26 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/VictorDCh/spider-clean-text-to-sql
下载链接
链接失效反馈官方服务:
资源简介:
该数据集主要用于文本到SQL生成任务,包含训练集、开发集和测试集。数据集的特征包括db_id、query、question和schema,分别表示数据库ID、SQL查询、自然语言问题和数据库模式。数据集的规模在1K到10K之间,适用于文本到SQL生成任务。
提供机构:
VictorDCh
原始信息汇总
数据集概述
语言
- 英语(en)
数据规模
- 1K<n<10K
任务类别
- 文本到文本生成(text2text-generation)
数据集信息
特征
- db_id: 字符串类型
- query: 字符串类型
- question: 字符串类型
- schema: 字符串类型
数据分割
- 训练集(train)
- 字节数: 15299773
- 样本数: 6016
- 验证集(dev)
- 字节数: 1142702
- 样本数: 665
- 测试集(test)
- 字节数: 3542050
- 样本数: 1929
数据大小
- 下载大小: 585756 字节
- 数据集大小: 19984525 字节
配置
- 默认配置(default)
- 数据文件路径:
- 训练集: data/train-*
- 验证集: data/dev-*
- 测试集: data/test-*
- 数据文件路径:
标签
- text-to-sql
- spider
- sql



