MatCha
收藏MatCha 数据集概述
数据集简介
MatCha 是首个专门针对材料表征图像理解设计的基准测试,旨在评估多模态大语言模型在解释真实世界材料表征成像数据方面的能力。
主要特征
- 包含 1,500 个专家级问题,专注于材料表征
- 涵盖材料研究的 4 个阶段 和 21 个不同任务
- 任务设计模拟 真实世界的科学挑战
- 提供 MLLMs 在材料表征领域的 首次系统性评估
数据集结构
text MatCha/ ├── MatCha_Data/data/ # 需从 HuggingFace 下载 └── src ├── lf_model_cfg/ ├── eval.py ├── models.py ├── score.py └── utils.py
数据获取
数据集可通过以下链接获取:
- HuggingFace 数据集地址:https://huggingface.co/datasets/FreedomIntelligence/MatCha
快速开始
1. 克隆仓库
bash git clone https://github.com/FreedomIntelligence/MatCha cd MatCha
2. 下载数据集
bash huggingface-cli download --repo-type dataset --resume-download ./FreedomIntelligence/MatCha --local-dir MatCha_Data
3. 运行评估
bash cd ./src/
python eval.py --model gpt-4o --method zero-shot
python score.py --output_path path/to/output/file
引用信息
bibtex @misc{lai2025matcha, title={Can Multimodal LLMs See Materials Clearly? A Multimodal Benchmark on Materials Characterization}, author={Zhengzhao Lai and Youbin Zheng and Zhenyang Cai and Haonan Lyu and Jinpu Yang and Hongqing Liang and Yan Hu and Benyou Wang}, year={2025}, eprint={2509.09307}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2509.09307}, }




