列表区域检测数据集
收藏魔搭社区2025-11-30 更新2024-11-16 收录
下载链接:
https://modelscope.cn/datasets/irhawks/paralist-det
下载链接
链接失效反馈官方服务:
资源简介:
列表区域检测任务主要用于检测文档图像中的带有序号和前导符的区域,识别整个列表所在的范围,列表区域原则上应包括无序列表、有序列表、描述列表三种,但当前我们统一标为List。本任务的数据预标注来自DocGenome,在此基础上用XAnyLabel进行人工调整。
The list region detection task primarily aims to detect regions with sequence numbers and leading symbols in document images, and identify the scope of the entire list. In principle, the list region should include three types: unordered lists, ordered lists, and description lists, but currently we uniformly label them as List. The pre-annotations for this task originate from DocGenome, and manual adjustments are carried out using XAnyLabel based on these pre-annotations.
提供机构:
maas
创建时间:
2024-11-05
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集专注于列表区域检测任务,旨在识别文档图像中包含数字或前导字符的列表区域,统一标注无序列表、有序列表和描述列表。该任务可与布局结构分析结合,通过位置关系推断列表项与正文等元素的关联,以辅助文档内容重建。
以上内容由遇见数据集搜集并总结生成



