five

MM-Hallu/BEAF

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/MM-Hallu/BEAF
下载链接
链接失效反馈
官方服务:
资源简介:
BEAF是一个用于评估视觉语言模型中对象幻觉的基准数据集,通过前后图像对比的方式构建。数据集包含26,064个问答对,覆盖2,223张图像(500张原始COCO图像和1,723张经过处理的图像)。每个数据样本包含图像、问题、真实答案等字段。问题采用POPE风格的二元问答形式,询问图像中是否存在特定对象。数据集还标注了图像是否为原始COCO图像、问题是否涉及被移除的对象等信息。问题分为四类:原始图像中存在的对象、原始图像中将被移除的对象、处理后图像中被移除的对象以及处理后图像中仍然存在的对象。评估指标包括准确率、精确率、召回率和F1分数。数据来源于ECCV 2024的BEAF项目。

BEAF is a benchmark for evaluating object hallucination in vision-language models using before-after image manipulation pairs. 26,064 QA pairs over 2,223 images (500 original COCO images + 1,723 manipulated images) with POPE-style yes/no questions. Each data sample includes fields such as image, question, ground truth answer, and annotations indicating whether the image is original COCO or whether the question refers to a removed object. Questions are categorized into four types: present objects in original images, to-be-removed objects in original images, removed objects in manipulated images, and remaining objects in manipulated images. Evaluation metrics include Accuracy, Precision, Recall, and F1. The data originates from the BEAF project presented at ECCV 2024.
提供机构:
MM-Hallu
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作