RamWithAPlan/preprocessed_yelp_for_bert
收藏Hugging Face2023-06-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/RamWithAPlan/preprocessed_yelp_for_bert
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: label
dtype:
class_label:
names:
'0': 1 star
'1': 2 star
'2': 3 stars
'3': 4 stars
'4': 5 stars
- name: text
dtype: string
- name: input_ids
sequence: int32
- name: token_type_ids
sequence: int8
- name: attention_mask
sequence: int8
splits:
- name: train
num_bytes: 2488411554
num_examples: 650000
- name: test
num_bytes: 191471188
num_examples: 50000
download_size: 0
dataset_size: 2679882742
---
# Dataset Card for "preprocessed_yelp_for_bert"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
RamWithAPlan
原始信息汇总
数据集概述
数据集名称
- 名称: preprocessed_yelp_for_bert
数据集特征
- 特征列表:
- label: 分类标签,包含以下类别:
- 0: 1 star
- 1: 2 star
- 2: 3 stars
- 3: 4 stars
- 4: 5 stars
- text: 文本类型
- input_ids: 序列类型,数据类型为int32
- token_type_ids: 序列类型,数据类型为int8
- attention_mask: 序列类型,数据类型为int8
- label: 分类标签,包含以下类别:
数据集分割
- 训练集:
- 样本数量: 650000
- 存储大小: 2488411554 字节
- 测试集:
- 样本数量: 50000
- 存储大小: 191471188 字节
数据集大小
- 总下载大小: 0 字节
- 总数据集大小: 2679882742 字节



