tjaffri/NSText2SQL-generate
收藏Hugging Face2023-08-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/tjaffri/NSText2SQL-generate
下载链接
链接失效反馈官方服务:
资源简介:
这是NSText2SQL数据集的重新格式化版本,专门用于微调生成模型。与标准NSText2SQL数据集相比,该版本移除了非英语问题、移除了包含多个输入表的行、更新了SQL查询以优先使用LIKE语句进行字符串匹配,并移除了语法无效的SQL查询。
This is a reformatted version of the NSText2SQL dataset, specifically designed for fine-tuning generative models. Compared to the standard NSText2SQL dataset, this version removes non-English questions, eliminates rows containing multiple input tables, updates SQL queries to prioritize LIKE statements for string matching, and removes syntactically invalid SQL queries.
提供机构:
tjaffri
原始信息汇总
NSText2SQL Dataset (Reformatted for Fine Tuned Generative Models)
数据集信息
- 特征:
question: 字符串类型table_info: 字符串类型sql_query: 字符串类型
- 分割:
train:- 字节数: 847766
- 样本数: 3473
- 下载大小: 391731
- 数据集大小: 847766
- 配置:
default:- 数据文件:
train:data/train-*
- 数据文件:
数据集修改
- 移除非英语问题
- 移除包含多个输入表的行
- 更新SQL查询,优先使用LIKE语句进行字符串匹配
- 移除语法无效的SQL查询



