Songweii/M3GIA

收藏

Hugging Face2024-06-27 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/Songweii/M3GIA

下载链接

链接失效反馈

官方服务：

资源简介：

M3GIA数据集是一个多语言和多模态的通用智能能力基准测试，旨在评估多模态大语言模型（MLLMs）的通用智能能力。数据集基于认知科学中的Cattell-Horn-Carrol（CHC）模型，识别了五个关键认知因素，并提出了新的评估指标。数据集涵盖了英语、中文、法语、西班牙语、葡萄牙语和韩语，确保数据收集自各自的文化背景，以避免英语中心偏见。数据集包含人类参与者的大量数据，揭示了最先进的MLLM在英语中达到了人类智能的下限，但在其他五种语言中仍存在显著差距。数据集将开源，以促进MLLMs认知能力的提升。

提供机构：

Songweii

原始信息汇总

数据集概述

名称: M3GIA

描述: M3GIA是一个认知驱动的多语言和多模态通用智能能力评估基准，旨在超越表面成就，深入理解多模态大型语言模型（MLLMs）的智能。该数据集基于Cattell-Horn-Carrol（CHC）模型，识别了五个关键认知因素，并提出了新的评估指标。

语言: 英语、中文、西班牙语、法语、葡萄牙语、韩语

许可证: Apache-2.0

数据结构:

中文: 测试数据路径为chinese_v1.parquet
英语: 测试数据路径为english_v1.parquet
西班牙语: 测试数据路径为spanish_v1.parquet
法语: 测试数据路径为french_v1.parquet
葡萄牙语: 测试数据路径为portuguese_v1.parquet
韩语: 测试数据路径为korean_v1.parquet

特点:

多语言支持，涵盖流行语言，避免英语中心偏见。
数据收集自各语言的本土文化背景，确保多样性和公正性。
揭示了当前最先进的MLLM在英语中达到人类智能的较低边界，而在其他五种语言中存在显著差异。
展示了与认知研究中发现的现象相一致的“胜者通吃”现象。

搜集汇总

数据集介绍

main_image_url

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集

© 2023-2025 上海数据发展科技有限责任公司版权所有

沪ICP备17003045号-15 沪公网安备31010402336585号

二维码

社区交流群

面向社区/商业的数据集话题

二维码

科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作