KPrashanth/my_gpt2_finetune_dataset_5M

Name: KPrashanth/my_gpt2_finetune_dataset_5M
Creator: KPrashanth
Published: 2024-06-08 06:37:49
License: 暂无描述

Hugging Face2024-06-08 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/KPrashanth/my_gpt2_finetune_dataset_5M

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含四个主要特征：文本、输入ID序列、注意力掩码序列和标签序列。数据集分为训练集、验证集和测试集，分别包含400万、50万和50万个样本。数据集的下载大小为495703244字节，总大小为972147316.0字节。

提供机构：

KPrashanth

原始信息汇总

数据集概述

config_name: default
- train: 数据文件路径为data/train-*。
- validation: 数据文件路径为data/validation-*。
- test: 数据文件路径为data/test-*。

5,000+

优质数据集

54 个

任务类型

进入经典数据集