mismatch-quest/SeeTRUE-Feedback

Name: mismatch-quest/SeeTRUE-Feedback
Creator: mismatch-quest
Published: 2024-03-07 13:22:01
License: 暂无描述

Hugging Face2024-03-07 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/mismatch-quest/SeeTRUE-Feedback

下载链接

链接失效反馈

官方服务：

资源简介：

SeeTRUE-Feedback数据集是一个用于图像-文本匹配/对齐反馈元评估的多样化基准。它旨在克服当前基准主要关注预测0-1匹配分数的局限性。SeeTRUE为每一行提供原始标题、与文本-图像错位相关的反馈，以及错位的标题+视觉来源（包括视觉错位的边界框）。该数据集仅支持英语，包含一个测试分组，不应被用于训练。

提供机构：

mismatch-quest

原始信息汇总

数据集卡片 for SeeTRUE-Feedback

数据集描述

SeeTRUE-Feedback 数据集是一个多样化的基准，用于元评估图像-文本匹配/对齐反馈。它旨在克服当前基准的局限性，这些基准主要关注预测 0-1 之间的匹配分数。SeeTRUE 为每一行提供了原始标题、与文本-图像错位相关的反馈，以及标题+视觉错位的来源（包括视觉错位的边界框）。

语言

数据集支持英语。

数据集结构

数据字段

image_caption - 与图像关联的标题。
image_name - 图像文件的名称。
dataset_source - 图像的来源/原始数据集。
id_in_source_dataset - 行源自的数据集的ID。
image_url - 可从中下载图像的S3链接。
human_feedback - 关于图像-文本错位的人工注释反馈。
feedback - 将反馈汇总为单个条目（由LLM生成：PaLM-2）。
feedback_clean - feedback字段的解析和“清洁”版本。
caption_misalignment - 图像标题中的错位来源。
visual_misalignment - 图像中的错位来源。
bbox_GroundingDino - 在GroundingDino输出格式中检测到的视觉错位边界框。
bbox_PaLI - 在PaLI输出格式中检测到的视觉错位边界框。

数据分割

SeeTRUE-Feedback 包含一个分割：TEST，不应用于训练。

数据集创建

该数据集是通过从多个数据集中获取和匹配图像和文本来创建的。更多信息见论文：<TODO>

许可信息

该数据集采用CC-By 4.0许可。

引用信息

TODO

搜集汇总

数据集介绍

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集