carnival13/nci_nq_t5_tokenized
收藏Hugging Face2023-10-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/carnival13/nci_nq_t5_tokenized
下载链接
链接失效反馈官方服务:
资源简介:
nci_nq_t5_tokenized数据集,包含多个分割(训练、评估、零样本评估、正常评估),每个分割有不同的文件路径和示例数量。数据集特征包括输入、标签、输入ID和注意力掩码,数据类型分别为字符串、整数64位、整数32位和整数8位。数据集大小为140490128字节,下载大小为61636686字节。
nci_nq_t5_tokenized数据集,包含多个分割(训练、评估、零样本评估、正常评估),每个分割有不同的文件路径和示例数量。数据集特征包括输入、标签、输入ID和注意力掩码,数据类型分别为字符串、整数64位、整数32位和整数8位。数据集大小为140490128字节,下载大小为61636686字节。
提供机构:
carnival13
原始信息汇总
数据集概述
数据集名称
- nci_nq_t5_tokenized
配置信息
- 默认配置 (
default)
数据文件路径
- 训练集 (
train):data/train-* - 评估集 (
eval):data/eval-* - 零样本评估集 (
eval_zero_shot):data/eval_zero_shot-* - 常规评估集 (
eval_normal):data/eval_normal-*
数据集特征
input: 字符串类型label: 整数序列类型input_ids: 整数序列类型attention_mask: 整数序列类型
数据集分割
- 训练集 (
train):- 字节数: 137430914
- 样本数: 177638
- 评估集 (
eval):- 字节数: 1529607
- 样本数: 7830
- 零样本评估集 (
eval_zero_shot):- 字节数: 562161
- 样本数: 2859
- 常规评估集 (
eval_normal):- 字节数: 967446
- 样本数: 4971
数据集大小
- 下载大小: 61636686 字节
- 数据集大小: 140490128 字节



