CORD 信息抽取数据集
收藏超神经2023-09-14 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/17171
下载链接
链接失效反馈官方服务:
资源简介:
CORD 全称 Consolidated Receipt Dataset for Post-OCR Parsing,是一个用于 Post-OCR 解析的收据数据集。该数据集包含数千张印度尼西亚收据(包含用于 OCR 的图像及 box/text 标注,以及用于解析的多级语义标签)。
CORD stands for Consolidated Receipt Dataset for Post-OCR Parsing, which is a receipt dataset dedicated to post-OCR parsing. This dataset includes thousands of Indonesian receipts, containing images for OCR, bounding box and text annotations, as well as multi-level semantic labels for parsing tasks.
创建时间:
2023-07-28
搜集汇总
数据集介绍

背景与挑战
背景概述
CORD信息抽取数据集是一个用于Post-OCR解析的收据数据集,包含数千张印度尼西亚收据的图像及OCR和语义标注。该数据集大小为1.91 GB,适用于图像分类任务,采用CC BY 4.0许可证。
以上内容由遇见数据集搜集并总结生成



