deepset/stackoverflow-survey-2023-text-sql
收藏Hugging Face2023-11-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/deepset/stackoverflow-survey-2023-text-sql
下载链接
链接失效反馈官方服务:
资源简介:
BIQA Text-to-SQL数据集来源于2023年Stack Overflow开发者调查,使用特定的Notebook和电子表格创建。数据集包含一个JSON文件和一个SQLite数据库文件。JSON文件中包含了一系列`SQLSample`对象,每个对象包含一个问题、可能的SQL查询及其结果,以及预测和评价信息。SQLite数据库文件是数据集的主要存储文件。
BIQA Text-to-SQL数据集来源于2023年Stack Overflow开发者调查,使用特定的Notebook和电子表格创建。数据集包含一个JSON文件和一个SQLite数据库文件。JSON文件中包含了一系列`SQLSample`对象,每个对象包含一个问题、可能的SQL查询及其结果,以及预测和评价信息。SQLite数据库文件是数据集的主要存储文件。
提供机构:
deepset
原始信息汇总
BIQA Text-to-SQL 数据集
数据来源
文件结构
data/eval_set_multi_answers_res.json: 包含问题和查询对,每个问题可能有多个有效 SQL 查询。同时包含结果。data/survey_results_normalized_v2.db: 主要的 sqlite 数据库文件。
数据格式
-
JSON 文件包含
SQLSample对象列表,定义如下: python @dataclass class SQLQuery: query: str results: Optional[list[tuple]] = None@dataclass class SQLSample: question: str labels: list[SQLQuery] prediction: Optional[SQLQuery] = None pred_eval: str = "" comment: str = ""
使用方法
- 可以通过 相关仓库 中的代码读取数据。



