five

theojiang/imdb-input_ids-label-pairs-256

收藏
Hugging Face2024-06-17 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/theojiang/imdb-input_ids-label-pairs-256
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含三个特征:label(标签,包含neg和pos两个类别)、input_mask(输入掩码,数据类型为int64序列)和input_ids(输入ID,数据类型为int32序列)。数据集分为三个部分:train(训练集,包含25,000个样本)、test(测试集,包含25,000个样本)和unsupervised(无监督集,包含50,000个样本)。数据集的下载大小为42,770,069字节,总大小为308,800,000字节。

The dataset contains three features: label (with two classes, neg and pos), input_mask (a sequence of int64), and input_ids (a sequence of int32). The dataset is divided into three splits: train (with 25,000 examples), test (with 25,000 examples), and unsupervised (with 50,000 examples). The download size of the dataset is 42,770,069 bytes, and the total size is 308,800,000 bytes.
提供机构:
theojiang
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作