theojiang/imdb-input_ids-label-pairs

Name: theojiang/imdb-input_ids-label-pairs
Creator: theojiang
Published: 2024-06-17 08:59:10
License: 暂无描述

Hugging Face2024-06-17 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/theojiang/imdb-input_ids-label-pairs

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集主要用于文本分类任务，包含三个特征：label用于区分正面和负面评价，input_mask和input_ids用于处理文本序列。数据集分为训练集、测试集和无监督学习集，每部分包含25000、25000和50000个样本，总下载大小为58482269字节，实际大小为616000000字节。

提供机构：

theojiang

原始信息汇总

数据集概述

config_name: default
- 数据文件路径:
  - train: data/train-*
  - test: data/test-*
  - unsupervised: data/unsupervised-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集