ComprehendEdit
收藏ComprehendEdit 数据集概述
数据集简介
ComprehendEdit 是一个综合的多模态知识编辑基准,包含八个多样化的任务,来源于多个数据集。该基准引入了两个新的评估指标:知识泛化指数(KGI) 和 知识保留指数(KPI),用于评估知识编辑对领域内样本的影响。
数据集结构
数据集的组织结构如下:
|——ComprehendEdit/ | |——GQA/ | | |——images/ | | | |——21.jpg | | | |——... | |——MathVista/ | | |——images/ | |——TallyQA/ | | |——VG_100K/ | | |——VG_100K_2/ | |——TextVQA/ | | |——train_images/ | |——VSR/ | | |——images/ | |——val2014/ |——ComprehendEdit_train.json |——ComprehendEdit_test.json |——ComprehendEdit_ori_right.json
数据样本格式
测试集中的每个样本格式如下:
[{ "image": "GQA/images/2405722.jpg", "question": "What is this bird called?", "rephrase": "What is the birds name?", # for Text-Generality "answer": "parrot", "source": "GQA", "Category": "object recognition", "pid": 0, "img_topk": [...], # pid of the image topk nearest samples in test set "txt_topk": [...], # pid of the text topk nearest samples in test set "img_last_topk": [...], # pid of the image topk farthest samples in test set "txt_last_topk": [...], # pid of the text topk farthest samples in test set "ori_rt_img_topk": [...], # pid of the image topk nearest samples in ComprehendEdit_ori_right.json "ori_rt_txt_topk": [...], # pid of the text topk nearest samples in ComprehendEdit_ori_right.json "ori_rt_img_last_topk": [...], # pid of the image topk farthest samples in ComprehendEdit_ori_right.json "ori_rt_txt_last_topk": [...], # pid of the text topk farthest samples in ComprehendEdit_ori_right.json "locality_prompt": "when does twice upon a time come out", # for Text-Locality "locality_ground_truth": "...", "multimodal_locality_image": "...", # for Multimodal-Locality "multimodal_locality_prompt": "...", "multimodal_locality_ground_truth": "..."}, ...]
数据集详情
数据集的详细信息如下表所示:
| 任务 | 训练集 | 测试集 | 来源 |
|---|---|---|---|
| 物体识别 | 1471 | 491 | GQA |
| 物体属性 | 2227 | 735 | GQA |
| 物体计数 | 2282 | 705 | GQA |
| 物体存在性 | 1506 | 503 | TallyQA |
| 场景信息 | 2067 | 787 | GQA |
| 数值推理 | 1709 | 530 | VSR |
| 空间关系 | 1554 | 519 | TextVQA |
| 文本识别 | 634 | 212 | MathVista |
| 总计 | 13450 | 4482 |
数据集来源
数据集来源于以下几个基准:
数据集下载
数据集可以从以下链接下载:下载链接

- 1ComprehendEdit: A Comprehensive Dataset and Evaluation Framework for Multimodal Knowledge Editing哈尔滨工业大学计算机学院、鹏城实验室、深圳先进技术研究院、西北工业大学计算机学院、广东省计算微电子重点实验室、中国科学院深圳先进技术研究院 · 2024年



