five

VALSE (VALSE: A Task-Independent Benchmark for Vision and Language Models Centered on Linguistic Phenomena)

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/VALSE
下载链接
链接失效反馈
官方服务:
资源简介:
我们提出了 VALSE(视觉和语言结构化评估),这是一种新颖的基准测试,旨在测试通用预训练视觉和语言 (V&L) 模型在特定语言现象上的视觉语言基础能力。 VALSE 提供一套六种测试,涵盖各种语言结构。解决这些问题需要模型以视觉形式中的语言现象为基础,从而允许比迄今为止可能的更细粒度的评估。我们希望 VALSE 能够作为一个重要的基准,从语言的角度衡量预训练的 V&L 模型的未来进展,补充以任务为中心的规范 V&L 评估。
提供机构:
OpenDataLab
创建时间:
2022-09-01
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作