WildVision/PublicBenchHub
收藏Hugging Face2024-02-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/WildVision/PublicBenchHub
下载链接
链接失效反馈官方服务:
资源简介:
这是一个多模态大型语言模型的公共基准集合,包括MMMU和TouchStone等,用于随机数据样本在WildVision Arena中的测试。
这是一个多模态大型语言模型的公共基准集合,包括MMMU和TouchStone等,用于随机数据样本在WildVision Arena中的测试。
提供机构:
WildVision
原始信息汇总
数据集概述
数据集信息
- 配置名称: touchstone
- 特征:
index: 数据类型为int64question: 数据类型为stringhuman_annotation: 数据类型为stringgpt4_ha_answer: 数据类型为stringcategory: 数据类型为stringtask_name: 数据类型为stringimage_input: 数据类型为image
数据分割
- 分割名称: test
- 字节数: 100776921.0
- 样本数量: 908
数据大小
- 下载大小: 51714254
- 数据集大小: 100776921.0
配置详情
- 配置名称: touchstone
- 数据文件:
- 分割: test
- 路径: touchstone/test-*
- 数据文件:
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个多模态公共基准集合,包含图像和文本数据,主要用于评估多模态大语言模型。数据集涵盖视觉识别、数学问题求解、情感识别等多种任务类型,共908行测试数据,适用于模型性能的随机采样和基准测试。
以上内容由遇见数据集搜集并总结生成



