Hexamind/spider-clean-text-to-sql
收藏Hugging Face2024-04-26 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Hexamind/spider-clean-text-to-sql
下载链接
链接失效反馈官方服务:
资源简介:
该数据集用于文本到SQL的生成任务,包含数据库ID、SQL查询、自然语言问题和数据库模式等特征。数据集分为训练集、开发集和测试集,分别包含6016、665和1929个样本。数据集的总大小为19984525字节,下载大小为585756字节。数据集的语言为英语,标签包括text-to-sql、sql和spider,适用于1K到10K样本规模的任务。
该数据集用于文本到SQL的生成任务,包含数据库ID、SQL查询、自然语言问题和数据库模式等特征。数据集分为训练集、开发集和测试集,分别包含6016、665和1929个样本。数据集的总大小为19984525字节,下载大小为585756字节。数据集的语言为英语,标签包括text-to-sql、sql和spider,适用于1K到10K样本规模的任务。
提供机构:
Hexamind
原始信息汇总
数据集概述
数据集特征
- db_id: 数据类型为字符串
- query: 数据类型为字符串
- question: 数据类型为字符串
- schema: 数据类型为字符串
数据集分割
- 训练集 (train): 包含6016个示例,总大小为15299773字节
- 开发集 (dev): 包含665个示例,总大小为1142702字节
- 测试集 (test): 包含1929个示例,总大小为3542050字节
数据集大小
- 下载大小: 585756字节
- 数据集总大小: 19984525字节
数据集配置
- 默认配置 (default) 下的数据文件路径:
- 训练集:
data/train-* - 开发集:
data/dev-* - 测试集:
data/test-*
- 训练集:
数据集属性
- 任务类别: 文本到文本生成 (text2text-generation)
- 语言: 英语 (en)
- 标签: 文本到SQL (text-to-sql), SQL, Spider
- 大小类别: 1K<n<10K



