GSEval
收藏GroundingSuite 数据集概述
数据集简介
GroundingSuite 是一个用于测量复杂多粒度像素级定位的全面框架。该框架包括一个自动化的基于 VLM 的标注管道,一个大规模数据集,一个全面的评估基准,以及展示了该方法有效性的最先进性能指标。
数据集特点
- 自动化的 VLM 标注管道:显著提高了标注效率
- 大规模数据集:包含 9.56M 多样化的训练样本
- 全面的评估基准:包含 3,800 个精心策划的实例
- 标注效率:比 GLaMM 快 4.5 倍
数据集构成
- 训练集:9.56M 个具有多样化指代表达式的样本
- 评估基准:3,800 个精心策划的实例
数据集下载
可以通过 Hugging Face 下载 GSEval。
使用方法
提供了基本的命令行使用方式以及参数配置,支持可视化结果生成。
数据格式
-
真实数据文件格式 (JSONL): json {"idx": 1, "image_path": "images/example.jpg", "box": [10, 20, 100, 200], "class_id": 0, "label": "dog"}
-
预测数据文件格式 (JSONL): json {"idx": 1, "image_path": "images/example.jpg", "box": [15, 25, 105, 205]}
评估指标
- Box 模式:计算 IoU(交并比)和准确度(IoU > 阈值)
- Mask 模式:计算 GIoU(平均 IoU)
引用
如果您的研究或应用中使用了 GroundingSuite,请考虑给我们一个 star ⭐ 并使用以下 BibTeX 条目引用:
bibtex @misc{hu2025groundingsuite, title={GroundingSuite: Measuring Complex Multi-Granular Pixel Grounding}, author={Rui Hu and Lianghui Zhu and Yuxuan Zhang and Tianheng Cheng and Lei Liu and Heng Liu and Longjin Ran and Xiaoxin Chen and Wenyu Liu and Xinggang Wang}, journal={arXiv preprint arXiv:2503.10596}, year={2025} }




