222,289张中文自然场景OCR数据【数据堂】
收藏OpenDataLab2024-05-22 更新2024-05-25 收录
下载链接:
https://opendatalab.org.cn/shujutang/shujutang244
下载链接
链接失效反馈官方服务:
资源简介:
222,289张中文自然场景OCR数据采集场景涵盖室内和室外场景。数据多样性包括多种场景和多种拍摄角度。在标注方面,对图像中文字进行行级标注、单词级标注、字符级标注和内容转写。本套中文自然场景OCR数据可用于自然场景OCR任务
This dataset comprises 222,289 Chinese natural scene OCR data samples, with collection scenarios covering both indoor and outdoor environments. The data exhibits diversity across various scenarios and shooting angles. For annotation, text within the images is annotated at line-level, word-level, and character-level, alongside complete content transcription. This Chinese natural scene OCR dataset is suitable for natural scene OCR tasks.
提供机构:
shujutang
创建时间:
2024-05-22
搜集汇总
数据集介绍

背景与挑战
背景概述
222,289张中文自然场景OCR数据,涵盖多种室内外场景和拍摄角度,提供行级、单词级和字符级标注,标注准确率不低于95%,适用于OCR任务。
以上内容由遇见数据集搜集并总结生成



