five

FUNSD

收藏
魔搭社区2026-01-06 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/FUNSD
下载链接
链接失效反馈
官方服务:
资源简介:
displayName: FUNSD (Form Understanding in Noisy Scanned Documents) labelTypes: - Semantic_seg_map - Text license: - FUNSD Custom mediaTypes: - Image paperUrl: https://arxiv.org/pdf/1905.13538v2.pdf publishDate: "2019" publishUrl: https://guillaumejaume.github.io/FUNSD/ publisher: - ETH Zurich - Istanbul Technical University tags: - Documents - Graph taskTypes: - Semantic Segmentation - Semantic Role Labeling - Text Information Extraction - Text Relation Extraction --- # 数据集介绍 ## 简介 嘈杂扫描文档中的表单理解 (FUNSD) 包含 199 个真实的、完全注释的扫描表单。文档嘈杂且外观差异很大,使得表单理解 (FoUn) 成为一项具有挑战性的任务。所提出的数据集可用于各种任务,包括文本检测、光学字符识别、空间布局分析和实体标记/链接。 ## 引文 ``` @inproceedings{jaume2019funsd, title={Funsd: A dataset for form understanding in noisy scanned documents}, author={Jaume, Guillaume and Ekenel, Hazim Kemal and Thiran, Jean-Philippe}, booktitle={2019 International Conference on Document Analysis and Recognition Workshops (ICDARW)}, volume={2}, pages={1--6}, year={2019}, organization={IEEE} } ``` ## Download dataset :modelscope-code[]{type="git"}

displayName: 显示名称:FUNSD(嘈杂扫描文档表单理解,Form Understanding in Noisy Scanned Documents) labelTypes: - 语义分割图(Semantic_seg_map) - 文本(Text) license: - FUNSD自定义许可(FUNSD Custom) mediaTypes: - 图像(Image) paperUrl: https://arxiv.org/pdf/1905.13538v2.pdf publishDate: "2019" publishUrl: https://guillaumejaume.github.io/FUNSD/ publisher: - 苏黎世联邦理工学院(ETH Zurich) - 伊斯坦布尔理工大学(Istanbul Technical University) tags: - 文档(Documents) - 图谱(Graph) taskTypes: - 语义分割(Semantic Segmentation) - 语义角色标注(Semantic Role Labeling) - 文本信息抽取(Text Information Extraction) - 文本关系抽取(Text Relation Extraction) --- # 数据集介绍 ## 简介 嘈杂扫描文档表单理解(FUNSD)数据集包含199份真实且已完成全标注的扫描表单。由于文档存在噪声且外观差异显著,表单理解(FoUn)任务极具挑战性。本数据集可应用于文本检测、光学字符识别、空间布局分析以及实体标记/链接等多项任务。 ## 引文 @inproceedings{jaume2019funsd, title={Funsd: A dataset for form understanding in noisy scanned documents}, author={Jaume, Guillaume and Ekenel, Hazim Kemal and Thiran, Jean-Philippe}, booktitle={2019 International Conference on Document Analysis and Recognition Workshops (ICDARW)}, volume={2}, pages={1--6}, year={2019}, organization={IEEE} } ## 数据集下载 :modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-02
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
FUNSD数据集包含199个真实且完全注释的嘈杂扫描表单,适用于多种文档理解任务,如文本检测和实体标记。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作