abderrazzak/LayoutLMv3-first
收藏Hugging Face2023-10-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/abderrazzak/LayoutLMv3-first
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含训练集和测试集,每个集的特征包括id、image、bboxes、ner_tags和tokens。ner_tags字段包含多个类别标签,如发票号码、供应商、发票日期等。数据集的训练集和测试集各包含1个示例,总大小为214766.0字节。
提供机构:
abderrazzak
原始信息汇总
数据集概述
配置
- 默认配置:
- 训练数据:路径为
data/train-* - 测试数据:路径为
data/test-*
- 训练数据:路径为
数据特征
- id:数据类型为
string - image:数据类型为
image - bboxes:序列类型,内部为
int64 - ner_tags:序列类型,包含类别标签及其名称:
0: O1: Numéro facture2: Fournisseur3: Date Facture4: Adresse5: Désignation6: Quantité7: Prix unitaire8: Total9: TotalHT10: TVA11: TotalTTc
- tokens:序列类型,数据类型为
string
数据分割
- 训练集:
- 字节数:107383.0
- 样本数:1
- 测试集:
- 字节数:107383.0
- 样本数:1
数据集大小
- 下载大小:0
- 数据集大小:214766.0



