five

IllusionAnimals 视觉错觉 VQA 数据集

收藏
超神经2025-03-10 更新2025-03-08 收录
下载链接:
https://hyper.ai/cn/datasets/38127
下载链接
链接失效反馈
官方服务:
资源简介:
IllusionAnimals 数据集是一个包含 2k 个样本的 FiftyOne 数据集,由伊朗科技大学的研究人员于 2024 年创建,相关论文成果为「Illusory VQA: Benchmarking and Enhancing Multimodal Models on Visual Illusions」。数据集中包含 10 个动物类别和一个无错觉类别,图像分辨率为 512×512 像素,用于评估多模态模型在识别和解释基于动物的视觉错觉方面的能力。

The IllusionAnimals dataset is a FiftyOne dataset containing 2k samples, created by researchers from Iran University of Science and Technology in 2024, with its associated academic paper titled "Illusory VQA: Benchmarking and Enhancing Multimodal Models on Visual Illusions". The dataset includes 10 animal categories and one non-illusion category, with all images having a resolution of 512×512 pixels. It is designed to evaluate the capability of multimodal models to recognize and interpret animal-based visual illusions.
创建时间:
2025-03-04
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
IllusionAnimals 视觉错觉 VQA 数据集是一个由伊朗科技大学研究人员于2024年创建的FiftyOne数据集,包含2k个样本,涵盖10个动物类别和一个无错觉类别,图像分辨率为512×512像素。该数据集旨在评估多模态模型在识别和解释基于动物的视觉错觉方面的能力,相关研究成果发表于论文'Illusory VQA: Benchmarking and Enhancing Multimodal Models on Visual Illusions'。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务