five

A4Bench

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/JunyingWang959/A4Bench/
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为A4Bench,旨在评估多模态大型语言模型(MLLMs)在两个维度上的可供性感知能力:构成性可供性和转化性可供性。具体来说,该数据集包含1282个构成性可供性的问答对和718个转化性可供性的问答对。该数据集分为两部分:一是1282个构成性可供性的问答对,二是718个转化性可供性的问答对,旨在评估MLLMs在理解各种情境下可供性的能力。整个数据集共有2000个问答对,覆盖了多个学科领域,其任务是对MLLMs的可供性感知能力进行评估。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作