micpst/bird-dev
收藏Hugging Face2024-07-10 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/micpst/bird-dev
下载链接
链接失效反馈官方服务:
资源简介:
BIRD-SQL数据集是一个用于SQL生成和问答任务的基准测试数据集。它包含多个特征,如问题ID、数据库ID、问题文本、证据文本、SQL查询和难度级别。数据集包含一个开发集,大小为588908字节,包含1534个示例。数据集的语言为英语,适用于问答、表格问答和文本生成任务。
The BIRD-SQL dataset is a benchmark dataset for SQL generation and question-answering tasks. It includes features such as question_id, db_id, question, evidence, sql, and difficulty, representing the unique identifier of the question, database identifier, question text, evidence text, SQL query, and difficulty level, respectively. The dataset contains a development set (dev) with a size of 588908 bytes and 1534 examples. The dataset is in English and is suitable for question-answering, table-question-answering, and text-generation tasks.
提供机构:
micpst
原始信息汇总
BIRD-SQL 数据集概述
数据集信息
特征
- question_id: 字符串类型
- db_id: 字符串类型
- question: 字符串类型
- evidence: 字符串类型
- sql: 字符串类型
- difficulty: 字符串类型
数据分割
- dev: 包含 1534 个样本,数据大小为 588908 字节
数据集大小
- 下载大小: 207968 字节
- 数据集大小: 588908 字节
配置
- default: 包含 dev 数据文件,路径为
data/dev-*
语言
- 英语
标签
- BIRD
- SQL
- text-to-SQL
规模分类
- 1K < n < 10K
任务分类
- 问答
- 表格问答
- 文本生成



