Nadav/pixel_glue_sst2_noisy_ocr
收藏Hugging Face2023-06-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Nadav/pixel_glue_sst2_noisy_ocr
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text
dtype: string
- name: label
dtype:
class_label:
names:
'0': '0'
'1': '1'
splits:
- name: train
num_bytes: 26112214
num_examples: 336745
- name: validation
num_bytes: 109851
num_examples: 872
download_size: 15815263
dataset_size: 26222065
---
# Dataset Card for "pixel_glue_sst2_noisy_ocr"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
特征:
- 名称:text,数据类型:字符串(string)
- 名称:label,数据类型:
类别标签(class_label),其类别名称映射为:
'0': '0'
'1': '1'
数据集划分:
- 名称:train
字节数:26112214
样本数:336745
- 名称:validation
字节数:109851
样本数:872
下载大小:15815263
数据集总大小:26222065
# 数据集卡片:"pixel_glue_sst2_noisy_ocr"
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Nadav
原始信息汇总
数据集概述
数据集名称
- 名称: pixel_glue_sst2_noisy_ocr
数据集特征
- 特征1: text
- 数据类型: string
- 特征2: label
- 数据类型: class_label
- 类别名称:
- 0: 0
- 1: 1
- 类别名称:
- 数据类型: class_label
数据集分割
- 训练集:
- 样本数量: 336745
- 数据大小: 26112214 字节
- 验证集:
- 样本数量: 872
- 数据大小: 109851 字节
数据集大小
- 下载大小: 15815263 字节
- 总数据大小: 26222065 字节



