five

LiZHENGzai/GPRadar-Defect-MultiTask

收藏
Hugging Face2026-03-27 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/LiZHENGzai/GPRadar-Defect-MultiTask
下载链接
链接失效反馈
官方服务:
资源简介:
--- language: - en license: mit pretty_name: PaliGemma Multitask Dataset size_categories: - 1K<n<10K task_categories: - object-detection - image-to-text task_ids: - visual-question-answering - image-captioning --- # GPRadar-Defect-MultiTask 数据集 本仓库包含用于微调PaLI-GEMMA多模态模型的地质雷达(GPR)缺陷检测数据集。该数据集专注于地下结构中的空洞和裂缝检测与分析。 ## 数据集结构 数据集组织如下: ``` dataset/ ├── annotations/ - 包含JSON和JSONL格式的标注文件 │ ├── _annotations.train.jsonl - 训练集标注 │ ├── _annotations.valid.jsonl - 验证集标注 │ ├── _annotations.test.jsonl - 测试集标注 │ ├── p-1.v1i.paligemma/ - 主数据集元数据 │ └── p-1.v1i.paligemma-multimodal/ - 多模态数据集元数据 ├── images/ - 包含所有图像文件 ``` ## 特点 - 包含874张带注释的地质雷达扫描图像 - 图像预处理为640x640像素大小 - 支持多种任务类型:缺陷检测、位置定位和描述生成 - 提供PaliGemma格式的注释,适用于多模态模型训练 ## 注释格式 数据集采用两种注释格式: 1. **JSONL格式**: 每行包含一条图像注释,格式如下: ```json {"image": "image_filename.jpg", "prefix": "detect void ; crack", "suffix": "<loc0486><loc0156><loc0750><loc0592> void"} ``` 2. **统一JSON格式**: 转换后的格式,每个注释包含图像文件名、边界框、标签和说明: ```json { "image_filename": "image_filename.jpg", "boxes": [[x1, y1, w1, h1], [x2, y2, w2, h2]], "labels": [0, 1], // 0表示void,1表示crack "caption": "描述图像中的缺陷", "source": "p1v1" } ``` ## 使用方法 ### 验证数据集 验证数据集的一致性: ```bash python run_upload.py --verify-only ``` ### 转换注释 将注释转换为统一格式: ```bash python run_upload.py --convert-only ``` ### 上传到Hugging Face Hub 将数据集上传到Hugging Face Hub: ```bash export HF_TOCKEN=your_huggingface_token python run_upload.py --repo-id your-username/GPRadar-Defect-MultiTask ``` ## 引用 如果您使用了这个数据集,请引用: ``` @misc{chen2024gprdefect, title={GPRadar-Defect-MultiTask Dataset}, author={Chen, Xingqiang}, year={2024}, publisher={Hugging Face} } ``` ## 许可证 数据集采用CC BY 4.0许可证。
提供机构:
LiZHENGzai
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作