five

14,980张8种语言PPT OCR数据

收藏
数据堂2024-05-23 收录
下载链接:
https://www.datatang.com/dataset/979
下载链接
链接失效反馈
官方服务:
资源简介:
14,980张8种语言PPT OCR数据涵盖8种语言、多种场景、不同拍摄角度、不同拍摄距离、不同光照条件。在标注方面,标注行级文本的四边形框,行级文本转写。本套多语言PPT OCR数据可用于多国语言OCR任务。

This multi-language PPT OCR dataset includes 14,980 samples covering 8 languages, with various scenarios, varying shooting angles, distances and lighting conditions. Regarding annotations, quadrilateral bounding boxes for line-level text and line-level text transcriptions are provided. This dataset can be used for multi-language OCR tasks.
提供机构:
数据堂
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含14,980张PPT图像,涵盖法文、韩文等8种语言,采集于会议室等场景,具有多种拍摄角度和光照条件。数据采用行级四边形框标注和文本转写,检测和转写精度均不低于95%,专用于多国语言OCR任务的训练和评估。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务