EdwardXJ/concat-debug-levels-scale
收藏Hugging Face2024-04-11 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/EdwardXJ/concat-debug-levels-scale
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: image
dtype: image
- name: sample_id
dtype: string
- name: ocr_bboxes
struct:
- name: paragraph
sequence: 'null'
- name: sentence
sequence: 'null'
- name: word
sequence:
sequence: float64
- name: ocr_predictions
struct:
- name: paragraph
sequence: 'null'
- name: sentence
sequence: 'null'
- name: word
sequence: string
splits:
- name: train
num_bytes: 16269016294.8
num_examples: 76413
- name: val
num_bytes: 2718906805.0
num_examples: 13224
- name: test
num_bytes: 173358778.0
num_examples: 150
download_size: 19106160634
dataset_size: 19161281877.8
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: val
path: data/val-*
- split: test
path: data/test-*
---
提供机构:
EdwardXJ
原始信息汇总
数据集概述
数据集特征
- image:图像数据类型。
- sample_id:字符串数据类型,用于标识样本。
- ocr_bboxes:结构化数据,包含以下子特征:
- paragraph:序列类型为空。
- sentence:序列类型为空。
- word:序列类型为浮点数64。
- ocr_predictions:结构化数据,包含以下子特征:
- paragraph:序列类型为空。
- sentence:序列类型为空。
- word:序列类型为字符串。
数据集划分
- train:包含76413个样本,占用16269016294.8字节。
- val:包含13224个样本,占用2718906805.0字节。
- test:包含150个样本,占用173358778.0字节。
数据集大小
- 下载大小:19106160634字节。
- 数据集总大小:19161281877.8字节。
数据文件配置
- default配置:
- train:路径为
data/train-*。 - val:路径为
data/val-*。 - test:路径为
data/test-*。
- train:路径为



