HanxuHU/mmmu_hi
收藏Hugging Face2024-04-04 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/HanxuHU/mmmu_hi
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个不同领域的配置,每个配置都包含30个验证集样本。每个样本包含问题、选项、解释、多个图像、图像类型、答案、主题难度、问题类型和子领域等特征。数据集涵盖了会计、农业、艺术理论、基础医学、临床医学、计算机科学、设计、诊断与实验室医学、经济学、能源与电力、金融、地理、历史、文学、管理、市场营销、机械工程、药学、物理和公共卫生等多个领域。
该数据集包含多个不同领域的配置,每个配置都包含30个验证集样本。每个样本包含问题、选项、解释、多个图像、图像类型、答案、主题难度、问题类型和子领域等特征。数据集涵盖了会计、农业、艺术理论、基础医学、临床医学、计算机科学、设计、诊断与实验室医学、经济学、能源与电力、金融、地理、历史、文学、管理、市场营销、机械工程、药学、物理和公共卫生等多个领域。
提供机构:
HanxuHU
原始信息汇总
数据集概述
数据集配置
| 配置名称 | 特征数量 | 验证集大小(字节) | 验证集示例数量 | 下载大小(字节) | 数据集大小(字节) |
|---|---|---|---|---|---|
| Accounting | 16 | 1609473.0 | 30 | 1539274 | 1609473.0 |
| Agriculture | 16 | 119222743.0 | 30 | 119225105 | 119222743.0 |
| Art_Theory | 16 | 33483629.0 | 30 | 29784920 | 33483629.0 |
| Basic_Medical_Science | 16 | 4129936.0 | 30 | 4136609 | 4129936.0 |
| Clinical_Medicine | 16 | 10891506.0 | 30 | 10892893 | 10891506.0 |
| Computer_Science | 16 | 2080345.0 | 30 | 2080452 | 2080345.0 |
| Design | 16 | 17926266.0 | 30 | 16229921 | 17926266.0 |
| Diagnostics_and_Laboratory_Medicine | 16 | 37109623.0 | 30 | 37091578 | 37109623.0 |
| Economics | 16 | 1495610.0 | 30 | 1428563 | 1495610.0 |
| Energy_and_Power | 16 | 1652832.0 | 30 | 1650422 | 1652832.0 |
| Finance | 16 | 1084455.0 | 30 | 1009255 | 1084455.0 |
| Geography | 16 | 6676888.0 | 30 | 6679705 | 6676888.0 |
| History | 16 | 8825392.0 | 30 | 8432650 | 8825392.0 |
| Literature | 16 | 14247233.0 | 30 | 14249204 | 14247233.0 |
| Manage | 16 | 3297553.0 | 30 | 3144334 | 3297553.0 |
| Marketing | 16 | 1484101.0 | 30 | 1365032 | 1484101.0 |
| Mechanical_Engineering | 16 | 883552.0 | 30 | 879690 | 883552.0 |
| Pharmacy | 16 | 1664210.0 | 30 | 1555441 | 1664210.0 |
| Physics | 16 | 1123334.0 | 30 | 1121942 | 1123334.0 |
| Public_Health | 16 | 1525333.0 | 30 | 1518689 | 1525333.0 |
特征描述
每个配置包含以下特征:
id: 字符串类型question: 字符串类型options: 字符串类型explanation: 字符串类型image_1至image_7: 图像类型img_type: 字符串类型answer: 字符串类型topic_difficulty: 字符串类型question_type: 字符串类型subfield: 字符串类型
每个配置的数据集均包含一个验证集,用于验证模型性能。



