NESPED-GEN/selector_testes
收藏Hugging Face2024-07-21 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/NESPED-GEN/selector_testes
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含与数据库查询相关的多个特征,如数据库ID(db_id)、模式(schema)、英文问题(question_en)等。数据集分为训练集(trainSpider)、开发集(devSpider)和测试集(testSpider),分别包含8656、1034和2147个样本。数据集的总大小为187618378字节,下载大小为2945633字节。
This dataset contains multiple features related to database queries, such as database ID (db_id), schema, English question (question_en), etc. The dataset is divided into three parts: trainSpider, devSpider, and testSpider, containing 8656, 1034, and 2147 samples respectively. The total size of the dataset is 187618378 bytes, and the download size is 2945633 bytes.
提供机构:
NESPED-GEN
原始信息汇总
数据集概述
特征信息
- db_id: 数据类型为字符串。
- schema: 数据类型为字符串。
- question_en: 数据类型为字符串。
- hardness: 数据类型为字符串。
- schema_llm: 数据类型为字符串。
- query_llm: 数据类型为字符串。
- selector: 数据类型为字符串。
- schema_llm_ct: 数据类型为字符串。
- schema_llm_columns_min: 数据类型为字符串。
- schema_llm_columns_min_ct: 数据类型为字符串。
- schema_llm_all_min: 数据类型为字符串。
- schema_llm_all_min_ct: 数据类型为字符串。
- schema_dict: 数据类型为字符串。
- selector_correct: 数据类型为字符串。
- schema_llm_t: 数据类型为字符串。
- schema_llm_columns_min_t: 数据类型为字符串。
- schema_llm_all_min_t: 数据类型为字符串。
数据分割
- trainSpider:
- 字节数: 148353904
- 样本数: 8656
- devSpider:
- 字节数: 12856179
- 样本数: 1034
- testSpider:
- 字节数: 26408295
- 样本数: 2147
数据集大小
- 下载大小: 2945633 字节
- 数据集总大小: 187618378 字节
配置信息
- config_name: default
- data_files:
- trainSpider: data/trainSpider-*
- devSpider: data/devSpider-*
- testSpider: data/testSpider-*
- data_files:



