行内元素检测数据集(SPD)
收藏魔搭社区2025-11-20 更新2024-11-16 收录
下载链接:
https://modelscope.cn/datasets/irhawks/span-det
下载链接
链接失效反馈官方服务:
资源简介:
在行内对文档图像中的公式、文本等元素进行检测,相比单行内容检测任务,粒度更细,任务区分和标注出行间公式、单行文本、行内公式、其他类型(插图、附表、算法块等)四类元素,每个检测出来的对象可以称为一个span。任务中所识别出来的每种元素,原则上均可按照元素的类型,送入不同的识别模型进行内容的识别。
Compared with single-line content detection tasks, this task operates at a finer granularity, aiming to detect elements such as formulas and text in document images. It specifically requires distinguishing and annotating four categories of elements: inter-line formulas, single-line text, intra-line formulas, and other types (including illustrations, attached tables, algorithm blocks, etc.). Each detected object can be termed a "span". In principle, elements of each identified category can be input into different recognition models for content recognition based on their types.
提供机构:
maas
创建时间:
2024-11-05
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集专注于文档图像中的行内元素检测任务,旨在识别和标注行内的文本、公式等细粒度元素,以支持后续的OCR和公式识别模型。它通过区分四种元素类型,为复杂文档的内容处理提供基础。
以上内容由遇见数据集搜集并总结生成



