GIE-Bench
收藏GIE-Bench数据集概述
数据集简介
- 名称:GIE-Bench (Grounded Evaluation for Text-Guided Image Editing)
- 用途:评估文本引导的图像编辑模型
- 评估维度:
- 功能正确性(Functional Correctness):通过GPT-4o进行多选题QA评估
- 内容保留度(Content Preservation):使用CLIP-Sim、SSIM、MSE、PSNR(掩码)等指标评估
数据集结构
GIE‑Bench/ ├── images2000urls/ # 包含URL列表和下载工具 │ └── download_images_from_urls.py ├── evaluation_script/ # 自动化评估脚本 │ ├── GPT‑4o_VQA_evaluation.py │ ├── masked_clip_ssim_evaluation.py │ ├── masked_mse_evaluation.py │ └── masked_psnr_evaluation.py ├── gie_bench_json.zip # 基准测试文件(压缩包) └── README.md
下载说明
-
原始图像: bash python images2000urls/download_images_from_urls.py
-
基准JSON文件: bash unzip gie_bench_json.zip # 解压后生成gie_bench.json
模型运行指南
-
推理过程:
- 加载
gie_bench.json - 为每个条目的
image生成编辑后的图像,遵循edit_instruction指令 - 保存编辑后的图像并更新JSON条目
- 加载
-
保存结果: python with open("results/my_model_output.json", "w") as f: json.dump(data, f, indent=2)
评估方法
-
功能正确性评估: bash python evaluation_script/GPT-4o_VQA_evaluation.py
-
内容保留度评估: bash python evaluation_script/masked_clip_ssim_evaluation.py path/to/your_model_output.json python evaluation_script/masked_mse_evaluation.py path/to/your_model_output.json python evaluation_script/masked_psnr_evaluation.py path/to/your_model_output.json python evaluation_script/clip_whole_image_evaluation.py path/to/your_model_output.json
引用信息
bibtex @article{qian2025gie, title={GIE-Bench: Towards Grounded Evaluation for Text-Guided Image Editing}, author={Qian, Yusu and Lu, Jiasen and Fu, Tsu-Jui and Wang, Xinze and Chen, Chen and Yang, Yinfei and Hu, Wenze and Gan, Zhe}, journal={arXiv preprint arXiv:2505.11493}, year={2025} }
许可信息
- 项目许可证:LICENSE
- 数据许可证:CC-by-NC-ND




