five

CORD 信息抽取数据集

收藏
超神经2023-09-14 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/17171
下载链接
链接失效反馈
官方服务:
资源简介:
CORD 全称 Consolidated Receipt Dataset for Post-OCR Parsing,是一个用于 Post-OCR 解析的收据数据集。该数据集包含数千张印度尼西亚收据(包含用于 OCR 的图像及 box/text 标注,以及用于解析的多级语义标签)。

CORD stands for Consolidated Receipt Dataset for Post-OCR Parsing, which is a receipt dataset dedicated to post-OCR parsing. This dataset includes thousands of Indonesian receipts, containing images for OCR, bounding box and text annotations, as well as multi-level semantic labels for parsing tasks.
创建时间:
2023-07-28
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
CORD信息抽取数据集是一个用于Post-OCR解析的收据数据集,包含数千张印度尼西亚收据的图像及OCR和语义标注。该数据集大小为1.91 GB,适用于图像分类任务,采用CC BY 4.0许可证。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务