ineoApp/data-test-old
收藏Hugging Face2024-06-04 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/ineoApp/data-test-old
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含图像和文本信息,主要用于发票相关信息的识别和分类。数据集的特征包括id、image、bboxes、ner_tags和tokens。ner_tags字段包含了发票中各种信息的标签,如发票号码、日期、金额、税率等。数据集分为训练集和测试集,训练集包含26个样本,测试集包含7个样本。
该数据集包含图像和文本信息,主要用于发票相关信息的识别和分类。数据集的特征包括id、image、bboxes、ner_tags和tokens。ner_tags字段包含了发票中各种信息的标签,如发票号码、日期、金额、税率等。数据集分为训练集和测试集,训练集包含26个样本,测试集包含7个样本。
提供机构:
ineoApp
原始信息汇总
数据集概述
数据集特征
- id: 字符串类型
- image: 图像类型
- bboxes: 序列类型,内部序列类型为整数
- ner_tags: 序列类型,包含多个类别标签,具体标签及其含义如下:
- 0: O
- 1: numero facture
- 2: date facture
- 3: date limite
- 4: montant ht
- 5: montant ttc
- 6: tva
- 7: prix tva
- 8: reference
- 9: Devise
- 10: Condition de paiement
- 11: Mode de paiement
- 12: vendeur
- 13: adresse vendeur
- 14: informations vendeur
- 15: ice vendeur
- 16: rc vendeur
- 17: if vendeur
- 18: patente vendeur
- 19: acheteur
- 20: adresse acheteur
- 21: informations acheteur
- 22: ice acheteur
- 23: art1 Article
- 24: art1 designation
- 25: art1 quantite
- 26: art1 unite
- 27: art1 prix unit
- 28: art1 montant ht
- 29: art1 taux de remise
- 30: art1 tva
- 31: art2 Article
- 32: art2 designation
- 33: art2 quantite
- 34: art2 unite
- 35: art2 prix unit
- 36: art2 montant ht
- 37: art2 taux de remise
- 38: art2 tva
- ...(此处省略后续标签)
- tokens: 序列类型,字符串类型
数据集分割
- train: 包含26个样本,数据量28202425字节
- test: 包含7个样本,数据量6560882字节
数据集大小
- 下载大小: 25150646字节
- 数据集总大小: 34763307字节
配置文件
- config_name: default
- data_files:
- train: 路径为
data/train-* - test: 路径为
data/test-*
- train: 路径为



