five

ramachetan22/sql-create-context-v2

收藏
Hugging Face2024-02-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ramachetan22/sql-create-context-v2
下载链接
链接失效反馈
官方服务:
资源简介:
`sql-create-context-v2`数据集是对原始WikiSQL和Spider数据集的增强,专注于文本到SQL任务,特别强调减少列名和表名的幻觉。此版本引入了JSONL格式以提高数据处理和迭代的效率,并采用结构化方法表示数据集条目中的SQL查询。关键增强包括数据集格式转换为JSON Lines (JSONL)和结构化查询表示。样本条目展示了数据集的结构,包括问题、上下文和SQL查询答案。

`sql-create-context-v2`数据集是对原始WikiSQL和Spider数据集的增强,专注于文本到SQL任务,特别强调减少列名和表名的幻觉。此版本引入了JSONL格式以提高数据处理和迭代的效率,并采用结构化方法表示数据集条目中的SQL查询。关键增强包括数据集格式转换为JSON Lines (JSONL)和结构化查询表示。样本条目展示了数据集的结构,包括问题、上下文和SQL查询答案。
提供机构:
ramachetan22
原始信息汇总

sql-create-context-v2 数据集

概述

sql-create-context-v2 数据集是在 WikiSQL 和 Spider 数据集的基础上进行增强的,专注于文本到 SQL 任务,特别强调减少列和表名的幻觉。该版本引入了 JSON Lines (JSONL) 格式,以提高大数据集的处理效率和迭代速度,并采用结构化的方法来表示数据集条目中的 SQL 查询。

关键增强

  • 数据集格式: 转换为 JSON Lines (JSONL) 格式,以改善大型数据集的处理和单个记录的流线型处理。
  • 结构化查询表示: 每个 SQL 查询答案现在都封装在一个以 SQL_Query 为键的对象中,便于查询文本和其他元数据的清晰分离。

示例条目

json { "question": "Please show the themes of competitions with host cities having populations larger than 1000.", "context": "CREATE TABLE city (City_ID VARCHAR, Population INTEGER); CREATE TABLE farm_competition (Theme VARCHAR, Host_city_ID VARCHAR)", "answer": {"SQL_Query": "SELECT T2.Theme FROM city AS T1 JOIN farm_competition AS T2 ON T1.City_ID = T2.Host_city_ID WHERE T1.Population > 1000"} }, { "question": "Please show the different statuses of cities and the average population of cities with each status.", "context": "CREATE TABLE city (Status VARCHAR, Population INTEGER)", "answer": {"SQL_Query": "SELECT Status, AVG(Population) FROM city GROUP BY Status"} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作