CORU
收藏arXiv2024-06-07 更新2024-06-21 收录
下载链接:
https://github.com/Update-For-Integrated-Business-AI/CORU
下载链接
链接失效反馈官方服务:
资源简介:
CORU数据集是由因斯布鲁克大学和DISCO公司联合开发的,旨在增强多语言环境下的OCR和收据信息提取能力。该数据集包含20,000条来自不同零售环境的收据,涵盖超市和服装店等多种场景。数据集创建过程中,通过严格的收集、标注和质量控制确保数据的多样性和真实性。CORU数据集特别适用于处理复杂和嘈杂的文档布局,如实际收据,并推动自动化多语言文档处理技术的发展。
提供机构:
因斯布鲁克大学
创建时间:
2024-06-07



