five

richardr1126/spider-context-validation-ranked-schema

收藏
Hugging Face2023-09-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/richardr1126/spider-context-validation-ranked-schema
下载链接
链接失效反馈
官方服务:
资源简介:
Spider是一个大规模、复杂且跨领域的语义解析和文本到SQL的数据集,由11名耶鲁学生标注。该数据集的目标是开发跨领域数据库的自然语言接口。此特定数据集用于验证基于Spider微调的大型语言模型(LLMs)的数据库上下文。数据集中的文本为英文,遵循CC BY-SA 4.0许可。

Spider是一个大规模、复杂且跨领域的语义解析和文本到SQL的数据集,由11名耶鲁学生标注。该数据集的目标是开发跨领域数据库的自然语言接口。此特定数据集用于验证基于Spider微调的大型语言模型(LLMs)的数据库上下文。数据集中的文本为英文,遵循CC BY-SA 4.0许可。
提供机构:
richardr1126
原始信息汇总

数据集卡片 for Spider Context Validation

数据集概述

数据集名称

Spider Context Validation Schema Ranked

标签

  • text-to-SQL
  • SQL
  • spider
  • validation
  • eval
  • spider-eval

数据集信息

  • features:
    • name: index
      • dtype: int32
    • name: db_id
      • dtype: string
    • name: question
      • dtype: string
    • name: db_info
      • dtype: string
    • name: ground_truth
      • dtype: string

数据集摘要

Spider 是一个大规模复杂且跨领域的语义解析和文本到 SQL 数据集,由 11 名耶鲁大学学生标注。Spider 挑战的目标是开发跨领域数据库的自然语言接口。

该数据集旨在验证具有数据库上下文的 spider-fine-tuned LLMs。

语言

数据集中的文本为英语。

许可信息

Spider 数据集的许可为 CC BY-SA 4.0

引用

@article{yu2018spider, title={Spider: A large-scale human-labeled dataset for complex and cross-domain semantic parsing and text-to-sql task}, author={Yu, Tao and Zhang, Rui and Yang, Kai and Yasunaga, Michihiro and Wang, Dongxu and Li, Zifan and Ma, James and Li, Irene and Yao, Qingning and Roman, Shanelle and others}, journal={arXiv preprint arXiv:1809.08887}, year={2018} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作