FUNSD
收藏魔搭社区2026-01-06 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/FUNSD
下载链接
链接失效反馈官方服务:
资源简介:
displayName: FUNSD (Form Understanding in Noisy Scanned Documents)
labelTypes:
- Semantic_seg_map
- Text
license:
- FUNSD Custom
mediaTypes:
- Image
paperUrl: https://arxiv.org/pdf/1905.13538v2.pdf
publishDate: "2019"
publishUrl: https://guillaumejaume.github.io/FUNSD/
publisher:
- ETH Zurich
- Istanbul Technical University
tags:
- Documents
- Graph
taskTypes:
- Semantic Segmentation
- Semantic Role Labeling
- Text Information Extraction
- Text Relation Extraction
---
# 数据集介绍
## 简介
嘈杂扫描文档中的表单理解 (FUNSD) 包含 199 个真实的、完全注释的扫描表单。文档嘈杂且外观差异很大,使得表单理解 (FoUn) 成为一项具有挑战性的任务。所提出的数据集可用于各种任务,包括文本检测、光学字符识别、空间布局分析和实体标记/链接。
## 引文
```
@inproceedings{jaume2019funsd,
title={Funsd: A dataset for form understanding in noisy scanned documents},
author={Jaume, Guillaume and Ekenel, Hazim Kemal and Thiran, Jean-Philippe},
booktitle={2019 International Conference on Document Analysis and Recognition Workshops (ICDARW)},
volume={2},
pages={1--6},
year={2019},
organization={IEEE}
}
```
## Download dataset
:modelscope-code[]{type="git"}
displayName: 显示名称:FUNSD(嘈杂扫描文档表单理解,Form Understanding in Noisy Scanned Documents)
labelTypes:
- 语义分割图(Semantic_seg_map)
- 文本(Text)
license:
- FUNSD自定义许可(FUNSD Custom)
mediaTypes:
- 图像(Image)
paperUrl: https://arxiv.org/pdf/1905.13538v2.pdf
publishDate: "2019"
publishUrl: https://guillaumejaume.github.io/FUNSD/
publisher:
- 苏黎世联邦理工学院(ETH Zurich)
- 伊斯坦布尔理工大学(Istanbul Technical University)
tags:
- 文档(Documents)
- 图谱(Graph)
taskTypes:
- 语义分割(Semantic Segmentation)
- 语义角色标注(Semantic Role Labeling)
- 文本信息抽取(Text Information Extraction)
- 文本关系抽取(Text Relation Extraction)
---
# 数据集介绍
## 简介
嘈杂扫描文档表单理解(FUNSD)数据集包含199份真实且已完成全标注的扫描表单。由于文档存在噪声且外观差异显著,表单理解(FoUn)任务极具挑战性。本数据集可应用于文本检测、光学字符识别、空间布局分析以及实体标记/链接等多项任务。
## 引文
@inproceedings{jaume2019funsd,
title={Funsd: A dataset for form understanding in noisy scanned documents},
author={Jaume, Guillaume and Ekenel, Hazim Kemal and Thiran, Jean-Philippe},
booktitle={2019 International Conference on Document Analysis and Recognition Workshops (ICDARW)},
volume={2},
pages={1--6},
year={2019},
organization={IEEE}
}
## 数据集下载
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-02
搜集汇总
数据集介绍

背景与挑战
背景概述
FUNSD数据集包含199个真实且完全注释的嘈杂扫描表单,适用于多种文档理解任务,如文本检测和实体标记。
以上内容由遇见数据集搜集并总结生成



