five

代码块检测数据集

收藏
魔搭社区2025-11-11 更新2024-09-21 收录
下载链接:
https://modelscope.cn/datasets/irhawks/code-det-240920
下载链接
链接失效反馈
官方服务:
资源简介:
从DocGenome数据集中分别抽取所标注的代码块,分别制作成算法块检测数据集`alg-det-dataset`,以及代码块检测数据集`code-det-dataset`,标注格式为YOLO-HBB,可用ultralytics直接训练。

Extract the annotated code blocks separately from the DocGenome dataset, and respectively create two detection datasets: the algorithm block detection dataset `alg-det-dataset` and the code block detection dataset `code-det-dataset`. The annotation format is YOLO-HBB, which can be directly trained using Ultralytics.
提供机构:
maas
创建时间:
2024-09-20
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个代码块检测数据集,专门用于检测文档图像中的代码块和算法块,以解决现有布局分析模型在此类元素识别上的性能不足。它基于DocGenome的标注构建,包含7,463张图像,并划分为训练、验证和测试集,旨在优化文档智能处理流程。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务