The Uber Text dataset
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/The_Uber_Text_dataset
下载链接
链接失效反馈官方服务:
资源简介:
近年来,由于深度学习社区的复兴,光学字符识别 (OCR) 方法得到了广泛的发展。最先进的模型主要是在由受约束的场景组成的数据集上训练的,这些场景涉及人类注释者的大量处理。从真实世界图像中检测和识别文本仍然是一项技术挑战。在本文中,我们介绍了一个大型OCR数据集uber-text,其中包含从车载传感器收集的街道级图像以及由图像分析师团队注释的真相。数据集的特征包括 (1) 带有文本区域多边形和相应转录的街边图像,(2) 指示企业名称文本,街道名称文本和街道编号文本等的9个类别,(3) 包含超过110k个图像的集合,(4) 平均每个图像4.84个文本实例。我们通过评估两种最近提出的对象检测方法来展示任务和数据集的挑战,这证明了数据集的重要性并激发了该研究领域的未来工作。此外,我们提出了一种端到端的文本序列识别方法,该方法无需词典,并且不需要字符级的预训练阶段。
提供机构:
OpenDataLab
创建时间:
2023-10-20



