SpatialScore
收藏SpatialScore数据集概述
数据集基本信息
- 名称: SpatialScore
- 类型: 多模态空间理解评估基准
- 包含子集: VGBench和SpatialScore
- 状态: 持续更新中(SpatialScore-Hard待发布)
核心功能
- 提供统一的多模态空间理解评估框架
- 支持Qwen2.5VL和InternVL系列模型的评估
- 包含SpatialAgent专家工具系统(开发中)
数据获取
- 主下载地址: Huggingface数据集仓库
- 备用下载方式: 使用hf-mirror镜像
- 下载命令: bash huggingface-cli download --resume-download --repo-type dataset haoningwu/SpatialScore --local-dir ./ --local-dir-use-symlinks False unzip SpatialScore.zip
评估方法
bash
Qwen2.5VL评估
CUDA_VISIBLE_DEVICES=0,1 python test_qwen.py --model_name qwen2_5vl-7b --model_path ./huggingface/Qwen2.5-VL-7B-Instruct --dataset_json_path ./dataset/SpatialScore.json --dataset_name all --output_dir ./eval_results
InternVL评估
CUDA_VISIBLE_DEVICES=0,1 python test_qwen.py --model_name internvl3-8b --model_path ./huggingface/InternVL3-8B --dataset_json_path ./dataset/SpatialScore.json --dataset_name all --output_dir ./eval_results
相关资源
- 论文: arXiv预印本
- 项目主页: GitHub Page
开发计划
- [ ] SpatialScore-Hard数据集发布
- [ ] 数据构建代码开源
- [ ] 全模型统一评估脚本
- [ ] SpatialAgent完整推理代码
引用格式
bibtex @article{wu2025spatialscore, author = {Wu, Haoning and Huang, Xiao and Chen, Yaohui and Zhang, Ya and Wang, Yanfeng and Xie, Weidi}, title = {SpatialScore: Towards Unified Evaluation for Multimodal Spatial Understanding}, journal = {arXiv preprint arXiv:2505.17012}, year = {2025}, }
系统要求
- Python ≥ 3.10
- PyTorch ≥ 2.5.1
- accelerate == 1.5.2
- triton == 3.2.0
- transformers == 4.51.3
联系方式
- 邮箱: haoningwu3639@gmail.com




