nqv2291/en-InstructUIE_NER-train-instructions_format-mT5
收藏Hugging Face2024-04-12 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/nqv2291/en-InstructUIE_NER-train-instructions_format-mT5
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: int64
- name: input_ids
sequence: int32
- name: attention_mask
sequence: int8
- name: labels
sequence: int64
splits:
- name: train
num_bytes: 1755105214
num_examples: 1209727
- name: validation
num_bytes: 263051933
num_examples: 210537
download_size: 141258633
dataset_size: 2018157147
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
---
数据集信息:
特征字段:
- 字段名:id,数据类型:int64(64位整数)
- 字段名:input_ids,数据类型:int32序列(32位整数序列)
- 字段名:attention_mask,数据类型:int8序列(8位整数序列)
- 字段名:labels,数据类型:int64序列(64位整数序列)
数据集划分:
- 划分名称:训练集(train),字节大小:1755105214,样本数:1209727
- 划分名称:验证集(validation),字节大小:263051933,样本数:210537
下载大小:141258633字节,数据集总大小:2018157147字节
配置项:
- 配置名称:默认配置(default),数据文件:
- 数据集划分:训练集(train),路径:data/train-*
- 数据集划分:验证集(validation),路径:data/validation-*
提供机构:
nqv2291
原始信息汇总
数据集概述
数据集特征
- id:整数类型,数据类型为 int64。
- input_ids:序列类型,数据类型为 int32。
- attention_mask:序列类型,数据类型为 int8。
- labels:序列类型,数据类型为 int64。
数据集分割
- 训练集:包含 1209727 个样本,占用 1755105214 字节。
- 验证集:包含 210537 个样本,占用 263051933 字节。
数据集大小
- 下载大小:141258633 字节。
- 数据集总大小:2018157147 字节。
配置文件
- 默认配置:包含训练集和验证集的数据文件路径。
- 训练集路径:
data/train-* - 验证集路径:
data/validation-*
- 训练集路径:



