five

MaRVL (Multicultural Reasoning over Vision and Language)

收藏
OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/MaRVL
下载链接
链接失效反馈
官方服务:
资源简介:
我们创建 a_x000D_ 多元文化推理的多语言数据集_x000D_ 通过从母语注释者中引出陈述来超越视觉和语言(MaRVL)_x000D_ 关于成对的图像。该任务包括区分每个有根据的语句是否是_x000D_ 对或错。我们建立了一系列baselines_x000D_ 使用最先进的模型并发现他们的_x000D_ 跨语言迁移性能明显落后于英语监督性能。_x000D_ 这些结果促使我们重新评估鲁棒性_x000D_ 当前最先进模型的准确性和准确性_x000D_ 超越狭隘的领域,还要开辟新的_x000D_ real_x000D_ 开发面临的激动人心的挑战 多语言和多文化系统

We present a multilingual dataset for multicultural reasoning, termed Multilingual Reasoning beyond Vision and Language (MaRVL), which is constructed by eliciting statements from native annotators regarding paired images. The task requires distinguishing whether each justified statement is correct or incorrect. We establish a series of baseline models using state-of-the-art methods, and find that their cross-language transfer performance significantly lags behind the performance achieved under English supervision. These results motivate us to re-evaluate the robustness and accuracy of current state-of-the-art models beyond narrow domains, and to explore exciting new challenges in the development of multilingual and multicultural systems.
提供机构:
OpenDataLab
创建时间:
2022-05-23
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
MaRVL是一个多语言多文化的视觉与语言推理数据集,通过母语注释者创建图像-语句对,要求判断语句的真假。它于2021年由多个学术机构发布,旨在评估模型在跨文化场景下的鲁棒性。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作