AIM-Harvard/3mqa_chinese
收藏Hugging Face2024-07-30 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/AIM-Harvard/3mqa_chinese
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: string
- name: type
dtype: string
- name: source_type
dtype: string
- name: source
dtype: string
- name: question
dtype: string
- name: option1
dtype: string
- name: option2
dtype: string
- name: option3
dtype: string
- name: option4
dtype: string
- name: image_1
dtype: image
- name: image_2
dtype: image
- name: image_3
dtype: image
- name: image_4
dtype: image
- name: image_5
dtype: image
- name: answer
dtype: string
- name: analysis
dtype: string
- name: distribution
dtype: string
- name: difficulty_level
dtype: string
- name: subcategory
dtype: string
- name: category
dtype: string
- name: subfield
dtype: string
- name: img_type
dtype: string
- name: image_1_filename
dtype: string
- name: image_2_filename
dtype: string
- name: image_3_filename
dtype: string
- name: image_4_filename
dtype: string
- name: image_5_filename
dtype: string
splits:
- name: dev
num_bytes: 1576539.4444444445
num_examples: 10
- name: val
num_bytes: 14405297.05882353
num_examples: 92
- name: test
num_bytes: 114337517.88954423
num_examples: 784
download_size: 148406569
dataset_size: 130319354.3928122
configs:
- config_name: default
data_files:
- split: dev
path: data/dev-*
- split: val
path: data/val-*
- split: test
path: data/test-*
---
A filtered subset of "m-a-p/CMMMU", "health_and_medicine"
数据集信息:
特征:
- 名称:id,数据类型:字符串
- 名称:type,数据类型:字符串
- 名称:source_type,数据类型:字符串
- 名称:source,数据类型:字符串
- 名称:question,数据类型:字符串
- 名称:option1,数据类型:字符串
- 名称:option2,数据类型:字符串
- 名称:option3,数据类型:字符串
- 名称:option4,数据类型:字符串
- 名称:image_1,数据类型:图像
- 名称:image_2,数据类型:图像
- 名称:image_3,数据类型:图像
- 名称:image_4,数据类型:图像
- 名称:image_5,数据类型:图像
- 名称:answer,数据类型:字符串
- 名称:analysis,数据类型:字符串
- 名称:distribution,数据类型:字符串
- 名称:difficulty_level,数据类型:字符串
- 名称:subcategory,数据类型:字符串
- 名称:category,数据类型:字符串
- 名称:subfield,数据类型:字符串
- 名称:img_type,数据类型:字符串
- 名称:image_1_filename,数据类型:字符串
- 名称:image_2_filename,数据类型:字符串
- 名称:image_3_filename,数据类型:字符串
- 名称:image_4_filename,数据类型:字符串
- 名称:image_5_filename,数据类型:字符串
划分集:
- 名称:dev(开发集),字节数:1576539.4444444445,样本数量:10
- 名称:val(验证集),字节数:14405297.05882353,样本数量:92
- 名称:test(测试集),字节数:114337517.88954423,样本数量:784
下载大小:148406569
数据集总大小:130319354.3928122
配置项:
- 配置名称:default,数据文件:
- 划分dev,路径:data/dev-*
- 划分val,路径:data/val-*
- 划分test,路径:data/test-*
本数据集为「m-a-p/CMMMU」的经筛选子集,主题为健康与医学(health_and_medicine)
提供机构:
AIM-Harvard



