five

fimu-docproc-research/CIVQA_EasyOCR_Validation

收藏
Hugging Face2023-11-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/fimu-docproc-research/CIVQA_EasyOCR_Validation
下载链接
链接失效反馈
官方服务:
资源简介:
CIVQA(捷克发票视觉问答)EasyOCR验证数据集是使用EasyOCR创建的,仅包含验证部分。该数据集中的发票来自公共资源,并聚焦于15个关键实体,这些实体对于处理发票至关重要。数据集的特征包括id、words、answers、bboxes、answers_bboxes、questions和image。数据集的许可证为MIT,主要语言为捷克语,标签为finance。
提供机构:
fimu-docproc-research
原始信息汇总

CIVQA EasyOCR Validation Dataset

数据集信息

特征

  • id: 字符串类型
  • words: 字符串序列
  • answers: 字符串类型
  • bboxes: 浮点数序列的序列
  • answers_bboxes: 浮点数序列的序列
  • questions: 字符串类型
  • image: 字符串类型

分割

  • validation: 包含34159个样本,大小为48446674074字节

下载和数据集大小

  • 下载大小: 10985782991字节
  • 数据集大小: 48446674074字节

许可和语言

  • 许可: MIT
  • 语言: 捷克语 (cs)

标签

  • finance

数据集描述

该数据集(CIVQA EasyOCR Validation Dataset)由EasyOCR创建,仅包含验证分割。数据集中的发票来自公共来源,重点关注15个不同的实体,这些实体对于处理发票至关重要。

关注实体

  • 发票号码
  • 变量符号
  • 特定符号
  • 常量符号
  • 银行代码
  • 账户号码
  • ICO
  • 总金额
  • 发票日期
  • 到期日期
  • 供应商名称
  • IBAN
  • DIC
  • QR码
  • 供应商地址

隐私声明

数据集中的发票来自互联网,如果您的可识别信息包含在此数据集中并希望将其从研究目的中删除,请访问以下链接:https://forms.gle/tUVJKoB22oeTncUD6

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作