SEDE
收藏魔搭社区2025-10-14 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/SEDE
下载链接
链接失效反馈官方服务:
资源简介:
displayName: SEDE (Stack Exchange Data Explorer)
license:
- Apache 2.0
mediaTypes:
- Text
paperUrl: https://arxiv.org/pdf/2106.05006v1.pdf
publishDate: "2021"
publishUrl: https://github.com/hirupert/sede
publisher:
- Tel Aviv University
- Columbia University
- Rupert
tags:
- SQL Sentence
taskTypes:
- Semantic Parsing
- Text To Sql
---
# 数据集介绍
## 简介
SEDE 是一个由 12,023 个复杂多样的 SQL 查询及其自然语言标题和描述组成的数据集,由 Stack Exchange 数据资源管理器的真实用户通过自然交互编写。这些对包含各种现实世界的挑战,到目前为止,这些挑战很少反映在任何其他语义解析数据集中。该数据集的目标是朝着在现实环境中评估 Text-to-SQL 模型迈出重要一步。与其他 Text-to-SQL 数据集相比,SEDE 包含的 SQL 查询模板(值规范化和匿名化后的查询)至少是其他数据集的 10 倍,并且拥有最多样化的话语和 SQL 查询集(就 3-克)在所有单域数据集中。 SEDE 引入了现实世界的挑战,例如规格不足、查询中参数的使用、日期操作等。
## 引文
```
@article{hazoom2021text,
title={Text-to-SQL in the Wild: A Naturally-Occurring Dataset Based on Stack Exchange Data},
author={Hazoom, Moshe and Malik, Vibhor and Bogin, Ben},
journal={arXiv preprint arXiv:2106.05006},
year={2021}
}
```
## Download dataset
:modelscope-code[]{type="git"}
displayName: SEDE(堆栈交换数据资源管理器,Stack Exchange Data Explorer)
license:
- Apache 2.0 许可证
mediaTypes:
- 文本
paperUrl: https://arxiv.org/pdf/2106.05006v1.pdf
publishDate: "2021"
publishUrl: https://github.com/hirupert/sede
publisher:
- 特拉维夫大学
- 哥伦比亚大学
- Rupert
tags:
- SQL语句(SQL Sentence)
taskTypes:
- 语义解析(Semantic Parsing)
- 文本到SQL(Text To Sql)
---
# 数据集介绍
## 简介
SEDE是一个包含12023条复杂多样的SQL查询及其自然语言标题与描述的数据集,其数据来源于堆栈交换(Stack Exchange)数据资源管理器的真实用户通过自然交互编写的查询。该数据集涵盖各类现实世界挑战,此类挑战目前在其他语义解析数据集中鲜有体现。本数据集旨在为现实场景下的文本到SQL模型评估迈出关键一步。与其他文本到SQL数据集相比,经值规范化与匿名化处理后的SEDE所包含的SQL查询模板数量至少为其他数据集的10倍,且在所有单域数据集中,其话语与SQL查询的3-gram多样性表现最为突出。SEDE引入了诸多现实场景挑战,例如规格不足、查询中参数的使用、日期操作等。
## 引文
@article{hazoom2021text,
title={野外场景下的文本到SQL:基于堆栈交换数据的自然生成数据集},
author={Hazoom, Moshe and Malik, Vibhor and Bogin, Ben},
journal={arXiv预印本 arXiv:2106.05006},
year={2021}
}
## 数据集下载
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-01



