five

micpst/bird-dev

收藏
Hugging Face2024-07-10 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/micpst/bird-dev
下载链接
链接失效反馈
官方服务:
资源简介:
BIRD-SQL数据集是一个用于SQL生成和问答任务的基准测试数据集。它包含多个特征,如问题ID、数据库ID、问题文本、证据文本、SQL查询和难度级别。数据集包含一个开发集,大小为588908字节,包含1534个示例。数据集的语言为英语,适用于问答、表格问答和文本生成任务。

The BIRD-SQL dataset is a benchmark dataset for SQL generation and question-answering tasks. It includes features such as question_id, db_id, question, evidence, sql, and difficulty, representing the unique identifier of the question, database identifier, question text, evidence text, SQL query, and difficulty level, respectively. The dataset contains a development set (dev) with a size of 588908 bytes and 1534 examples. The dataset is in English and is suitable for question-answering, table-question-answering, and text-generation tasks.
提供机构:
micpst
原始信息汇总

BIRD-SQL 数据集概述

数据集信息

特征

  • question_id: 字符串类型
  • db_id: 字符串类型
  • question: 字符串类型
  • evidence: 字符串类型
  • sql: 字符串类型
  • difficulty: 字符串类型

数据分割

  • dev: 包含 1534 个样本,数据大小为 588908 字节

数据集大小

  • 下载大小: 207968 字节
  • 数据集大小: 588908 字节

配置

  • default: 包含 dev 数据文件,路径为 data/dev-*

语言

  • 英语

标签

  • BIRD
  • SQL
  • text-to-SQL

规模分类

  • 1K < n < 10K

任务分类

  • 问答
  • 表格问答
  • 文本生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作