场景文本检测数据集(STD)
收藏魔搭社区2025-12-19 更新2024-11-16 收录
下载链接:
https://modelscope.cn/datasets/irhawks/scenetext-det
下载链接
链接失效反馈官方服务:
资源简介:
由于当前OCR等识别技术的局限性,当前多数系统仍然需要从视觉丰富文档(Visually Rich Document)图像中检测出可被文本识别模型或公式识别模型接受的区域。本数据集按照传统的场景文本检测模型的思路,在给定的文档图像中检测出来所有的场景文字。包括PPOCR在内的现行的多数文本检测模型均属于此类。
Due to the limitations of current recognition technologies such as OCR, most existing systems still need to detect regions from images of Visually Rich Documents that can be recognized by text recognition models or formula recognition models. This dataset adopts the framework of traditional scene text detection models, which detects all scene texts within given document images. Most current text detection models, including PPOCR, fall into this category.
提供机构:
maas
创建时间:
2024-11-05
搜集汇总
数据集介绍

背景与挑战
背景概述
场景文本检测数据集(STD)专注于文档图像中的场景文本检测任务,旨在识别图像中所有可识别的文本内容,以支持文本识别模型。它遵循传统场景文本检测方法,用于辅助文档内容处理,如OCR系统。
以上内容由遇见数据集搜集并总结生成



