five

jiyatai/ALIGN-BENCH

收藏
Hugging Face2023-12-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/jiyatai/ALIGN-BENCH
下载链接
链接失效反馈
官方服务:
资源简介:
ALIGN-BENCH数据集旨在定量测量视觉-语言模型的跨模态对齐能力。其核心思想是利用融合编码器最后一层的交叉注意力图,并与标注区域进行比较,从而计算全局-局部和局部-局部的对齐分数。数据集包含1500张图像和1500个标注文件,每个标注文件包含一个标题和一些单词在图像上的区域(边界框和像素掩码)。

ALIGN-BENCH数据集旨在定量测量视觉-语言模型的跨模态对齐能力。其核心思想是利用融合编码器最后一层的交叉注意力图,并与标注区域进行比较,从而计算全局-局部和局部-局部的对齐分数。数据集包含1500张图像和1500个标注文件,每个标注文件包含一个标题和一些单词在图像上的区域(边界框和像素掩码)。
提供机构:
jiyatai
原始信息汇总

ALIGN-BENCH 数据集概述

数据集目的

ALIGN-BENCH 旨在定量测量视觉-语言模型的跨模态对齐。

数据集核心思想

利用融合编码器最后一层的跨注意力图,并与某些单词对应的标注区域进行比较。

对齐评分计算

ALIGN-BENCH 可以从全局-局部和局部-局部两个角度计算对齐分数,包括边界框和像素掩码。

数据集内容

  • 包含1,500张图像和1,500个标注文件。
  • 每个标注文件包含一个标题和图像上某些单词的区域(边界框和像素掩码)。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作