five

14,980张8种语言PPT OCR数据【数据堂】

收藏
OpenDataLab2024-05-22 更新2024-05-25 收录
下载链接:
https://opendatalab.org.cn/shujutang/shujutang979
下载链接
链接失效反馈
官方服务:
资源简介:
14,980张8种语言PPT OCR数据涵盖8种语言、多种场景、不同拍摄角度、不同拍摄距离、不同光照条件。在标注方面,标注行级文本的四边形框,行级文本转写。本套多语言PPT OCR数据可用于多国语言OCR任务

This dataset includes 14,980 PPT OCR samples covering 8 languages, with diverse scenarios, varying shooting angles, shooting distances, and lighting conditions. For annotation, quadrilateral bounding boxes are employed to delineate line-level text regions, and line-level text transcription is conducted. This multilingual PPT OCR dataset can be applied to multilingual OCR tasks.
提供机构:
shujutang
创建时间:
2024-05-22
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含14,980张PPT图像,涵盖法文、韩文等8种语言,采集自会议室环境,使用手机从不同角度和光照条件拍摄。标注内容包括行级文本的四边形框和转写,精度不低于95%,适用于多语言OCR任务,但仅限企业合作购买使用。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务