MoritzLaurer/image2markdown
收藏Hugging Face2024-04-30 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/MoritzLaurer/image2markdown
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
config_name: pixparse_idl-wds
features:
- name: __key__
dtype: string
- name: __url__
dtype: string
- name: json
struct:
- name: pages
list:
- name: bbox
sequence:
sequence: float64
- name: poly
list:
list:
- name: X
dtype: float64
- name: Y
dtype: float64
- name: score
sequence: float64
- name: text
sequence: string
- name: ocr
dtype: binary
- name: pdf
dtype: binary
- name: tif
dtype: image
- name: encoded_image
dtype: string
- name: text_markdown
dtype: string
splits:
- name: train
num_bytes: 141167744.0
num_examples: 100
download_size: 126433464
dataset_size: 141167744.0
configs:
- config_name: pixparse_idl-wds
data_files:
- split: train
path: pixparse_idl-wds/train-*
---
提供机构:
MoritzLaurer
原始信息汇总
数据集概述
数据集信息
- 配置名称: pixparse_idl-wds
- 特征:
- key: 字符串类型
- url: 字符串类型
- json: 结构体类型
- pages: 列表类型
- bbox: 浮点数序列
- poly: 列表类型
- X: 浮点数类型
- Y: 浮点数类型
- score: 浮点数序列
- text: 字符串序列
- pages: 列表类型
- ocr: 二进制类型
- pdf: 二进制类型
- tif: 图像类型
- encoded_image: 字符串类型
- text_markdown: 字符串类型
数据集分割
- 训练集:
- 名称: train
- 字节数: 141167744.0
- 样本数: 100
数据集大小
- 下载大小: 126433464
- 数据集大小: 141167744.0
配置详情
- 配置名称: pixparse_idl-wds
- 数据文件:
- 分割: train
- 路径: pixparse_idl-wds/train-*



