five

Deformation Wired Table (DWTAL)

收藏
arXiv2025-04-29 更新2025-05-01 收录
下载链接:
https://github.com/justliulong/OGHFYOLO
下载链接
链接失效反馈
官方服务:
资源简介:
DWTAL数据集是为了解决变形表格的单元格定位问题而创建的。该数据集由南昌航空大学的研究团队开发,包含了从TAL-OCR和WTW数据集中选取的轻微变形表格,经过数据生成器处理,生成了大量变形表格数据。数据集被分为两个独立的部分:DWTAL-s和DWTAL-l,分别包含8765张和19520张变形表格。这些数据集为变形表格的单元格定位提供了丰富且精细的空间坐标信息,支持像素级分割模型的训练,有助于解决下游任务中的内容获取问题。

The DWTAL dataset was developed to tackle the issue of cell localization for deformed tables. Developed by the research team at Nanchang Hangkong University, this dataset includes slightly deformed tables selected from the TAL-OCR and WTW datasets, and a substantial amount of deformed table data was generated through a dedicated data generator. The dataset is divided into two separate subsets: DWTAL-s and DWTAL-l, which respectively contain 8765 and 19520 deformed table images. These datasets provide rich and precise spatial coordinate information for cell localization of deformed tables, enabling the training of pixel-level segmentation models and facilitating the resolution of content acquisition issues in downstream tasks.
提供机构:
南昌航空大学
创建时间:
2025-04-29
原始信息汇总

OG-HFYOLO数据集概述

数据集基本信息

  • 数据集名称:OG-HFYOLO
  • 主要用途:变形表格单元格实例分割
  • 相关论文:arXiv:2504.20682

数据集格式与存储

  • 主要存储格式:YOLO格式
    • 数据集名称:

    • 目录结构示例:

      DWTAL-s ├── image │ ├── train │ └── val └── label ├── train └── val

其他格式支持

数据转换工具

  • 转换脚本位置:./dataprocess
    • 包含脚本:
      • yolo2coco.py
      • yolo2labelme.py
      • labelme2yolo.py
      • labelme2coco.py
  • 数据生成器:./dataprocess/data_gen.py

使用要求

  • Python版本:≥3.8.0

  • PyTorch版本:≥1.8

  • 依赖安装:

    pip install -r requirements.txt 或 conda env create -f environment.yaml

许可信息

  • 许可证类型:GNU Affero General Public License v3.0 (AGPL-3.0)
搜集汇总
数据集介绍
main_image_url
构建方式
Deformation Wired Table (DWTAL) 数据集的构建采用了创新的数据生成器方法,通过从现有数据集TAL-OCR和WTW中筛选轻度变形的表格,并将其标签转换为细粒度的分割注释。随后,这些注释数据被输入到数据生成器中,生成大量变形表格数据。数据生成器结合了波浪形扭曲、圆柱形扭曲和光照调整三种操作,通过参数随机化模拟自然变形。最终,数据集被划分为DWTAL-s和DWTAL-l两部分,分别包含8,765张和19,520张表格图像,以支持实例分割模型的训练。
使用方法
DWTAL数据集的使用方法主要包括模型训练和评估。在训练阶段,研究人员可以利用数据集中的细粒度分割注释来训练实例分割模型,如OG-HFYOLO。评估阶段则通过标准指标如mAP、模型参数数量和GFLOPs来量化模型性能。数据集还支持与其他主流实例分割模型的对比实验,以验证新方法的有效性。此外,数据集的开源特性允许研究社区进一步扩展和改进其应用场景。
背景与挑战
背景概述
Deformation Wired Table (DWTAL) 数据集由南昌航空大学的Long Liu和Cihui Yang等研究人员于2025年提出,旨在填补变形表格单元格细粒度空间坐标定位领域的数据空白。该数据集源自公开数据集TAL-OCR和WTW,通过创新的数据生成器扩充形成,包含DWTAL-s(8,765张简单表格)和DWTAL-l(19,520张复杂表格)两个子集。其核心研究问题是解决物理变形(如弯曲、透视畸变)导致的表格结构识别困难,为文档分析领域提供了首个支持像素级实例分割的基准数据集,显著提升了变形表格内容与结构的关联性分析能力。
当前挑战
DWTAL数据集面临双重挑战:在领域问题层面,变形表格中密集排列的单元格共享轮廓线,且合并单元格导致目标尺度极端多样化(如过宽或过窄的单元格),传统基于关键点检测或文本框分割的方法难以准确提取空间坐标。在构建过程中,数据生成需精确模拟自然场景变形(如波浪扭曲、柱面扭曲),同时保持标注的像素级精度;此外,现有数据集WTW和TAL-OCR的原始标注粒度粗糙,需通过算法将其转化为实例分割所需的掩码标注,这对标注一致性与几何保真度提出了极高要求。
常用场景
经典使用场景
Deformation Wired Table (DWTAL) 数据集在表格结构识别领域具有重要应用价值,特别是在处理几何变形表格的实例分割任务中表现突出。该数据集通过模拟真实场景中的弯曲、透视畸变和光照变化等复杂条件,为研究者提供了丰富的训练样本。其经典使用场景包括文档分析中的表格结构重建、变形表格的像素级分割以及表格内容与结构的精确关联。数据集通过精细标注的单元格空间坐标,为下游任务如内容恢复和逻辑结构推断奠定了坚实基础。
解决学术问题
DWTAL 数据集有效解决了变形表格识别中的关键学术问题。传统方法在严重几何变形条件下难以保持单元格内容与结构的强相关性,导致下游任务无法获取准确信息。该数据集填补了细粒度空间坐标定位的数据空白,支持实例分割模型的训练与评估。通过引入梯度方向感知提取器和异构核交叉融合模块,显著提升了模型对密集排列单元格和多尺度目标的处理能力,为变形表格的精确解析提供了可靠的技术路线。
实际应用
在实际应用层面,DWTAL 数据集广泛应用于金融报表数字化、教育资料电子化和科学实验数据分析等领域。其生成的变形表格图像高度还原了扫描文档和自然场景拍摄中的真实畸变情况,使得训练模型具备处理复杂现实场景的鲁棒性。数据集支持的OG-HFYOLO模型在保持实时性的同时,在CamCap等真实摄影数据集上展现出优异的泛化能力,为文档数字化系统提供了核心技术支持。
数据集最近研究
最新研究方向
近年来,Deformation Wired Table (DWTAL) 数据集在文档分析与表格结构识别领域引起了广泛关注。该数据集专注于解决变形表格中单元格的细粒度空间坐标定位问题,填补了现有数据集中对严重变形表格实例分割标注的空白。前沿研究主要集中在基于实例分割的变形表格结构识别技术上,特别是通过梯度方向感知提取器(GOE)和异构核交叉融合模块(HKCF)等技术提升模型在密集目标分布和大尺度变化场景下的性能。这些技术不仅显著提高了变形表格的识别精度,还为下游任务如内容恢复和逻辑坐标处理提供了更丰富的信息。此外,DWTAL数据集的推出为相关领域的研究提供了重要的基准数据,推动了变形表格识别技术的进一步发展。
相关研究论文
  • 1
    OG-HFYOLO :Orientation gradient guidance and heterogeneous feature fusion for deformation table cell instance segmentation南昌航空大学 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作