five

DocLayNet

收藏
Opencsg2023-01-25 更新2025-05-03 收录
下载链接:
https://www.opencsg.com/datasets/AIWizards/DocLayNet
下载链接
链接失效反馈
官方服务:
资源简介:
DocLayNet提供页面布局分割能力,它基于来自金融、科学、专利、招标、法律文本和手册等6个文档类别中80863个独特页面的数据集,数据集中每个页面都使用边界框进行标注,总共包含11个不同的类别标签。DocLayNet的数据规模属于1万到10万之间,标注信息由众包完成,采用COCO格式。数据集包含PNG图像、COCO格式的边界框标注、单页PDF文件以及包含坐标和内容的JSON文件四种类型的数据资产,并预定义了训练集、验证集和测试集。该数据集支持目标检测和图像分割等任务,并采用CDLA-Permissive-1.0许可协议。
创建时间:
2024-07-19
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作