five

deepset/stackoverflow-survey-2023-text-sql

收藏
Hugging Face2023-11-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/deepset/stackoverflow-survey-2023-text-sql
下载链接
链接失效反馈
官方服务:
资源简介:
BIQA Text-to-SQL数据集来源于2023年Stack Overflow开发者调查,使用特定的Notebook和电子表格创建。数据集包含一个JSON文件和一个SQLite数据库文件。JSON文件中包含了一系列`SQLSample`对象,每个对象包含一个问题、可能的SQL查询及其结果,以及预测和评价信息。SQLite数据库文件是数据集的主要存储文件。

BIQA Text-to-SQL数据集来源于2023年Stack Overflow开发者调查,使用特定的Notebook和电子表格创建。数据集包含一个JSON文件和一个SQLite数据库文件。JSON文件中包含了一系列`SQLSample`对象,每个对象包含一个问题、可能的SQL查询及其结果,以及预测和评价信息。SQLite数据库文件是数据集的主要存储文件。
提供机构:
deepset
原始信息汇总

BIQA Text-to-SQL 数据集

数据来源

文件结构

  • data/eval_set_multi_answers_res.json: 包含问题和查询对,每个问题可能有多个有效 SQL 查询。同时包含结果。
  • data/survey_results_normalized_v2.db: 主要的 sqlite 数据库文件。

数据格式

  • JSON 文件包含 SQLSample 对象列表,定义如下: python @dataclass class SQLQuery: query: str results: Optional[list[tuple]] = None

    @dataclass class SQLSample: question: str labels: list[SQLQuery] prediction: Optional[SQLQuery] = None pred_eval: str = "" comment: str = ""

使用方法

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作