five

数据堂—14,980张8种语言PPT OCR数据

收藏
魔搭社区2025-12-04 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/DatatangBeijing/14980ImagesPPTOCRDataof8Languages
下载链接
链接失效反馈
官方服务:
资源简介:
14,980张8种语言PPT OCR数据涵盖8种语言、多种场景、不同拍摄角度、不同拍摄距离、不同光照条件。在标注方面,标注行级文本的四边形框,行级文本转写。本套多语言PPT OCR数据可用于多国语言OCR任务。

This dataset contains 14,980 PPT OCR samples across 8 languages, with diverse scenarios, varying shooting angles, shooting distances and lighting conditions. Annotations include quadrilateral bounding boxes for line-level text and corresponding line-level text transcriptions. This multilingual PPT OCR dataset can be applied to multilingual OCR tasks.
提供机构:
maas
创建时间:
2024-04-26
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含14,980张图像,涵盖法语、韩语等8种语言,适用于多语言OCR测试任务。数据采集自会议室和会议厅等多样场景,包含不同拍摄角度、距离和光照条件,并提供了行级文本的四边形框标注和转录内容。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务