five

THUDM/AlignMMBench

收藏
Hugging Face2024-09-19 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/THUDM/AlignMMBench
下载链接
链接失效反馈
官方服务:
资源简介:
AlignMMBench是一个用于评估中文多模态对齐的大型视觉语言模型的基准测试数据集。该数据集包含单轮和多轮对话场景,涵盖三个类别和十三个能力任务,共有4,978个问答对。数据集的特点包括高质量的人工注释、引入基于ChatGLM3-6B的CritiqueVLM评估器以提高对齐评估的可控性,以及多样化的数据。数据集的使用受CC BY-NC-SA 4.0许可证的约束。
提供机构:
THUDM
原始信息汇总

AlignMMBench: Evaluating Chinese Multimodal Alignment in Large Vision-Language Models

数据集概述

基本信息

  • 许可证: CC BY-NC-SA 4.0
  • 任务类别: 视觉问答
  • 语言: 中文
  • 标签: 图像, 对齐
  • 数据集名称: AlignMMBench
  • 数据集大小: 1K<n<10K

数据集介绍

  • 数据集类型: 多模态对齐基准
  • 场景: 包含单轮和多轮对话场景
  • 任务类别: 三类,共十三项能力任务
  • 数据量: 4,978个问答对

特点

  1. 高质量标注: 经过细致的人工标注和多阶段质量控制流程。
  2. 自我批评: 引入基于ChatGLM3-6B的CritiqueVLM评估器,经过规则校准和精细调整,评估一致性超过GPT-4。
  3. 数据多样性: 包含三类和十三项能力任务,涵盖单轮和多轮对话场景。

许可证

  • 数据集和原始视频的使用受Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)许可证约束。

引用

bibtex @misc{wu2024alignmmbench, title={AlignMMBench: Evaluating Chinese Multimodal Alignment in Large Vision-Language Models}, author={Yuhang Wu and Wenmeng Yu and Yean Cheng and Yan Wang and Xiaohan Zhang and Jiazheng Xu and Ming Ding and Yuxiao Dong}, year={2024}, eprint={2406.09295}, archivePrefix={arXiv} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作