Spider|语义解析数据集|文本到SQL数据集
收藏arXiv2019-02-03 更新2024-06-21 收录
下载链接:
https://yale-lily.github.io/spider
下载链接
链接失效反馈资源简介:
Spider是由耶鲁大学计算机科学系创建的大规模、复杂且跨领域的语义解析和文本到SQL的数据集。该数据集包含10,181个问题和5,693个独特的复杂SQL查询,涉及200个数据库,覆盖138个不同领域。数据集由11名大学生耗时1,000小时标注完成。Spider数据集旨在解决模型在面对新SQL查询和新数据库模式时的泛化能力问题,特别强调了模型需要理解自然语言问题以及数据库模式中表和列之间的关系。该数据集的应用领域广泛,主要用于测试和提升模型在复杂查询和跨领域数据库处理上的性能。
提供机构:
耶鲁大学计算机科学系
创建时间:
2018-09-24
