AayushShah/Univeral_SQL_Three_Datasets_Combined_WithText_IDs
收藏Hugging Face2023-10-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/AayushShah/Univeral_SQL_Three_Datasets_Combined_WithText_IDs
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为Univeral_SQL_Three_Datasets_Combined_WithText_IDs,包含三个分割:context、text_sql_v1和sparc。每个分割都有对应的数据文件路径、字节大小和示例数量。数据集的特征包括自然语言(NATURAL_LANG)、SQL语句(SQL)、数据库模式(SCHEMA)、输入ID(input_ids)、注意力掩码(attention_mask)和标签(labels)。
该数据集名为Univeral_SQL_Three_Datasets_Combined_WithText_IDs,包含三个分割:context、text_sql_v1和sparc。每个分割都有对应的数据文件路径、字节大小和示例数量。数据集的特征包括自然语言(NATURAL_LANG)、SQL语句(SQL)、数据库模式(SCHEMA)、输入ID(input_ids)、注意力掩码(attention_mask)和标签(labels)。
提供机构:
AayushShah
原始信息汇总
数据集概述
数据集名称
Univeral_SQL_Three_Datasets_Combined_WithText_IDs
数据集配置
- 默认配置 (
default)- 数据文件路径:
context:data/context-*text_sql_v1:data/text_sql_v1-*sparc:data/sparc-*
- 数据文件路径:
数据集信息
-
特征 (features):
NATURAL_LANG: 数据类型为stringSQL: 数据类型为stringSCHEMA: 数据类型为stringinput_ids: 序列类型为int32attention_mask: 序列类型为int8labels: 序列类型为int64
-
数据集分割 (splits):
context:- 字节数: 299674929
- 样本数: 78519
text_sql_v1:- 字节数: 899253880
- 样本数: 220302
sparc:- 字节数: 12250417
- 样本数: 2846
数据集大小
- 下载大小: 94153422 字节
- 数据集大小: 1211179226 字节



