kevinjesse/typebert
收藏Hugging Face2023-04-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/kevinjesse/typebert
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: input_ids
sequence: int64
- name: labels
sequence: int64
splits:
- name: train
num_bytes: 11927159712
num_examples: 2906228
- name: validation
num_bytes: 70371288
num_examples: 17147
- name: test
num_bytes: 70371288
num_examples: 17147
download_size: 851542645
dataset_size: 12067902288
---
# Dataset Card for "typebert"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
kevinjesse
原始信息汇总
数据集概述
数据集特征
- input_ids:序列类型为
int64。 - labels:序列类型为
int64。
数据集分割
- 训练集 (train):
- 大小:11927159712 字节
- 样本数:2906228
- 验证集 (validation):
- 大小:70371288 字节
- 样本数:17147
- 测试集 (test):
- 大小:70371288 字节
- 样本数:17147
数据集大小
- 下载大小:851542645 字节
- 总数据集大小:12067902288 字节



