fimu-docproc-research/CIVQA_EasyOCR_Validation
收藏Hugging Face2023-11-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/fimu-docproc-research/CIVQA_EasyOCR_Validation
下载链接
链接失效反馈官方服务:
资源简介:
CIVQA(捷克发票视觉问答)EasyOCR验证数据集是使用EasyOCR创建的,仅包含验证部分。该数据集中的发票来自公共资源,并聚焦于15个关键实体,这些实体对于处理发票至关重要。数据集的特征包括id、words、answers、bboxes、answers_bboxes、questions和image。数据集的许可证为MIT,主要语言为捷克语,标签为finance。
提供机构:
fimu-docproc-research
原始信息汇总
CIVQA EasyOCR Validation Dataset
数据集信息
特征
- id: 字符串类型
- words: 字符串序列
- answers: 字符串类型
- bboxes: 浮点数序列的序列
- answers_bboxes: 浮点数序列的序列
- questions: 字符串类型
- image: 字符串类型
分割
- validation: 包含34159个样本,大小为48446674074字节
下载和数据集大小
- 下载大小: 10985782991字节
- 数据集大小: 48446674074字节
许可和语言
- 许可: MIT
- 语言: 捷克语 (cs)
标签
- finance
数据集描述
该数据集(CIVQA EasyOCR Validation Dataset)由EasyOCR创建,仅包含验证分割。数据集中的发票来自公共来源,重点关注15个不同的实体,这些实体对于处理发票至关重要。
关注实体
- 发票号码
- 变量符号
- 特定符号
- 常量符号
- 银行代码
- 账户号码
- ICO
- 总金额
- 发票日期
- 到期日期
- 供应商名称
- IBAN
- DIC
- QR码
- 供应商地址
隐私声明
数据集中的发票来自互联网,如果您的可识别信息包含在此数据集中并希望将其从研究目的中删除,请访问以下链接:https://forms.gle/tUVJKoB22oeTncUD6



