five

SPIDER

收藏
Opencsg2024-03-25 更新2024-06-22 收录
下载链接:
https://www.opencsg.com/datasets/OpenDataLab/SPIDER
下载链接
链接失效反馈
官方服务:
资源简介:
Spider 是由 11 名耶鲁大学学生注释的大规模复杂跨域语义解析和文本到 SQL 数据集。 Spider 挑战的目标是开发跨域数据库的自然语言接口。它由 10,181 个问题和 5,693 个独特的复杂 SQL 查询组成,涉及 200 个数据库,多个表涵盖 138 个不同的域。在 Spider 1.0 中,不同的复杂 SQL 查询和数据库出现在训练和测试集中。要想在这方面做得好,系统必须不仅能很好地泛化到新的 SQL 查询,还必须能很好地泛化到新的数据库模式。

Spider is a large-scale complex cross-domain semantic parsing and text-to-SQL dataset annotated by 11 Yale University students. The goal of the Spider challenge is to develop natural language interfaces for cross-domain databases. It consists of 10,181 questions and 5,693 distinct complex SQL queries, covering 200 databases with multiple tables spanning 138 different domains. In Spider 1.0, different complex SQL queries and databases appear in the training and test sets. To perform well in this task, systems must not only generalize well to new SQL queries but also to new database schemas.
创建时间:
2024-03-25
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
SPIDER是一个大规模复杂跨域语义解析和文本到SQL数据集,由耶鲁大学学生注释,包含10,181个问题和5,693个独特SQL查询,覆盖200个数据库和138个不同域。该数据集旨在推动跨域数据库自然语言接口的开发,要求系统能泛化到新的SQL查询和数据库模式,适用于问答和文本分类任务。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作