five

SEDE

收藏
魔搭社区2025-10-14 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/SEDE
下载链接
链接失效反馈
官方服务:
资源简介:
displayName: SEDE (Stack Exchange Data Explorer) license: - Apache 2.0 mediaTypes: - Text paperUrl: https://arxiv.org/pdf/2106.05006v1.pdf publishDate: "2021" publishUrl: https://github.com/hirupert/sede publisher: - Tel Aviv University - Columbia University - Rupert tags: - SQL Sentence taskTypes: - Semantic Parsing - Text To Sql --- # 数据集介绍 ## 简介 SEDE 是一个由 12,023 个复杂多样的 SQL 查询及其自然语言标题和描述组成的数据集,由 Stack Exchange 数据资源管理器的真实用户通过自然交互编写。这些对包含各种现实世界的挑战,到目前为止,这些挑战很少反映在任何其他语义解析数据集中。该数据集的目标是朝着在现实环境中评估 Text-to-SQL 模型迈出重要一步。与其他 Text-to-SQL 数据集相比,SEDE 包含的 SQL 查询模板(值规范化和匿名化后的查询)至少是其他数据集的 10 倍,并且拥有最多样化的话语和 SQL 查询集(就 3-克)在所有单域数据集中。 SEDE 引入了现实世界的挑战,例如规格不足、查询中参数的使用、日期操作等。 ## 引文 ``` @article{hazoom2021text, title={Text-to-SQL in the Wild: A Naturally-Occurring Dataset Based on Stack Exchange Data}, author={Hazoom, Moshe and Malik, Vibhor and Bogin, Ben}, journal={arXiv preprint arXiv:2106.05006}, year={2021} } ``` ## Download dataset :modelscope-code[]{type="git"}

displayName: SEDE(堆栈交换数据资源管理器,Stack Exchange Data Explorer) license: - Apache 2.0 许可证 mediaTypes: - 文本 paperUrl: https://arxiv.org/pdf/2106.05006v1.pdf publishDate: "2021" publishUrl: https://github.com/hirupert/sede publisher: - 特拉维夫大学 - 哥伦比亚大学 - Rupert tags: - SQL语句(SQL Sentence) taskTypes: - 语义解析(Semantic Parsing) - 文本到SQL(Text To Sql) --- # 数据集介绍 ## 简介 SEDE是一个包含12023条复杂多样的SQL查询及其自然语言标题与描述的数据集,其数据来源于堆栈交换(Stack Exchange)数据资源管理器的真实用户通过自然交互编写的查询。该数据集涵盖各类现实世界挑战,此类挑战目前在其他语义解析数据集中鲜有体现。本数据集旨在为现实场景下的文本到SQL模型评估迈出关键一步。与其他文本到SQL数据集相比,经值规范化与匿名化处理后的SEDE所包含的SQL查询模板数量至少为其他数据集的10倍,且在所有单域数据集中,其话语与SQL查询的3-gram多样性表现最为突出。SEDE引入了诸多现实场景挑战,例如规格不足、查询中参数的使用、日期操作等。 ## 引文 @article{hazoom2021text, title={野外场景下的文本到SQL:基于堆栈交换数据的自然生成数据集}, author={Hazoom, Moshe and Malik, Vibhor and Bogin, Ben}, journal={arXiv预印本 arXiv:2106.05006}, year={2021} } ## 数据集下载 :modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-01
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作