amaye15/receipts-json
收藏Hugging Face2024-05-01 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/amaye15/receipts-json
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: pixel_values
dtype: image
- name: label
dtype:
class_label:
names:
'0': Barcode
'1': Invoice
'2': Object
'3': Receipt
'4': Non-Object
- name: ocr
list:
- name: bounding box
struct:
- name: vertex 0
struct:
- name: x
dtype: int64
- name: y
dtype: int64
- name: vertex 1
struct:
- name: x
dtype: int64
- name: y
dtype: int64
- name: vertex 2
struct:
- name: x
dtype: int64
- name: y
dtype: int64
- name: vertex 3
struct:
- name: x
dtype: int64
- name: y
dtype: int64
- name: text
dtype: string
- name: text
dtype: string
splits:
- name: train
num_bytes: 1750352.0
num_examples: 2
- name: test
num_bytes: 5401523.0
num_examples: 2
download_size: 7086158
dataset_size: 7151875.0
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
---
提供机构:
amaye15
原始信息汇总
数据集概述
数据集特征
- pixel_values: 图像数据
- label: 分类标签,包括以下类别:
- 0: Barcode
- 1: Invoice
- 2: Object
- 3: Receipt
- 4: Non-Object
- ocr: 包含以下子特征:
- bounding box: 边界框信息,包含四个顶点坐标:
- vertex 0: 第一个顶点坐标,包括
x和y坐标 - vertex 1: 第二个顶点坐标,包括
x和y坐标 - vertex 2: 第三个顶点坐标,包括
x和y坐标 - vertex 3: 第四个顶点坐标,包括
x和y坐标
- vertex 0: 第一个顶点坐标,包括
- text: 文本内容
- bounding box: 边界框信息,包含四个顶点坐标:
- text: 文本内容
数据集分割
- train: 训练集,包含 2 个样本,大小为 1750352 字节
- test: 测试集,包含 2 个样本,大小为 5401523 字节
数据集大小
- 下载大小: 7086158 字节
- 数据集大小: 7151875.0 字节
配置信息
- config_name: default
- data_files:
- train: 训练集文件路径为
data/train-* - test: 测试集文件路径为
data/test-*
- train: 训练集文件路径为
- data_files:



