arcee-train/9-2-combined-dataset
收藏Hugging Face2024-09-11 更新2025-04-08 收录
下载链接:
https://hf-mirror.com/datasets/arcee-train/9-2-combined-dataset
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: input_ids_1
sequence: int64
- name: attention_mask_1
sequence: int64
- name: labels_1
sequence: int64
- name: input_ids_2
sequence: int64
- name: attention_mask_2
sequence: int64
- name: labels_2
sequence: int64
- name: input_ids_3
sequence: int64
- name: attention_mask_3
sequence: int64
- name: labels_3
sequence: int64
- name: input_ids_4
sequence: int64
- name: attention_mask_4
sequence: int64
- name: labels_4
sequence: int64
splits:
- name: train
num_bytes: 340018224
num_examples: 1729
download_size: 10301307
dataset_size: 340018224
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征:
- 名称:输入ID序列1(input_ids_1)
类型:64位整数序列
- 名称:注意力掩码序列1(attention_mask_1)
类型:64位整数序列
- 名称:标签序列1(labels_1)
类型:64位整数序列
- 名称:输入ID序列2(input_ids_2)
类型:64位整数序列
- 名称:注意力掩码序列2(attention_mask_2)
类型:64位整数序列
- 名称:标签序列2(labels_2)
类型:64位整数序列
- 名称:输入ID序列3(input_ids_3)
类型:64位整数序列
- 名称:注意力掩码序列3(attention_mask_3)
类型:64位整数序列
- 名称:标签序列3(labels_3)
类型:64位整数序列
- 名称:输入ID序列4(input_ids_4)
类型:64位整数序列
- 名称:注意力掩码序列4(attention_mask_4)
类型:64位整数序列
- 名称:标签序列4(labels_4)
类型:64位整数序列
数据集划分:
- 名称:训练集
占用字节数:340018224
样本数量:1729
下载大小:10301307
数据集总大小:340018224
配置项:
- 配置名称:默认配置
数据文件:
- 划分:训练集
文件路径:data/train-*
提供机构:
arcee-train



