five

数据堂—105,941张12种语言自然场景OCR数据

收藏
魔搭社区2025-11-21 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/DatatangBeijing/105941ImagesNaturalScenesOCRDataof12Languages
下载链接
链接失效反馈
官方服务:
资源简介:
105,941张12种语言自然场景OCR数据涵盖12种语言,包括6种亚洲语、6种欧洲语,采集覆盖多种自然场景、多种拍摄角度。在标注方面,标注行级文本的四边形框,行级文本转写。本套数据可用于多国语言OCR任务

105,941 natural scene OCR samples covering 12 languages, including 6 Asian languages and 6 European languages. The data was collected across diverse natural scenes and various shooting angles. In terms of annotation, it includes quadrilateral bounding boxes and transcriptions for line-level text. This dataset can be used for multilingual OCR tasks.
提供机构:
maas
创建时间:
2024-05-07
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含105,941张自然场景图像,涵盖12种语言(包括6种亚洲和6种欧洲语言),用于多语言OCR测试任务。图像采集自多种场景和角度,标注内容包括行级文本的四边形边界框和转录,检测与转录准确率均不低于97%。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务