marcelomoreno26/processed-receipts
收藏Hugging Face2024-04-04 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/marcelomoreno26/processed-receipts
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: ground_truth
dtype: string
- name: pixel_values
sequence:
sequence:
sequence: float32
- name: labels
sequence: int64
- name: target_sequence
dtype: string
splits:
- name: train
num_bytes: 8419528948
num_examples: 1013
- name: validation
num_bytes: 2111092299
num_examples: 254
- name: test
num_bytes: 3923067240
num_examples: 472
download_size: 2126351712
dataset_size: 14453688487
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
- split: test
path: data/test-*
---
dataset_info:
features:
- name: 真实标签(ground_truth)
dtype: 字符串
- name: 像素值(pixel_values)
sequence:
sequence:
sequence: float32
- name: 标签(labels)
sequence: int64
- name: 目标序列(target_sequence)
dtype: 字符串
splits:
- name: 训练集(train)
num_bytes: 8419528948
num_examples: 1013
- name: 验证集(validation)
num_bytes: 2111092299
num_examples: 254
- name: 测试集(test)
num_bytes: 3923067240
num_examples: 472
download_size: 2126351712
dataset_size: 14453688487
configs:
- config_name: 默认(default)
data_files:
- split: 训练集
path: data/train-*
- split: 验证集
path: data/validation-*
- split: 测试集
path: data/test-*
提供机构:
marcelomoreno26
原始信息汇总
数据集概述
数据集特征
- ground_truth: 数据类型为字符串。
- pixel_values: 数据类型为序列,序列内部为浮点型32位。
- labels: 数据类型为序列,序列内部为整型64位。
- target_sequence: 数据类型为字符串。
数据集分割
- 训练集 (train): 包含1013个样本,占用8419528948字节。
- 验证集 (validation): 包含254个样本,占用2111092299字节。
- 测试集 (test): 包含472个样本,占用3923067240字节。
数据集大小
- 下载大小: 2126351712字节。
- 数据集总大小: 14453688487字节。
数据文件配置
- 默认配置 (default):
- 训练集路径:
data/train-* - 验证集路径:
data/validation-* - 测试集路径:
data/test-*
- 训练集路径:



