WildVision/PublicBenchHub

收藏

Hugging Face2024-02-22 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/WildVision/PublicBenchHub

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个多模态大型语言模型的公共基准集合，包括MMMU和TouchStone等，用于随机数据样本在WildVision Arena中的测试。

这是一个多模态大型语言模型的公共基准集合，包括MMMU和TouchStone等，用于随机数据样本在WildVision Arena中的测试。

提供机构：

WildVision

原始信息汇总

数据集概述

数据集信息

配置名称: touchstone
特征:
- index: 数据类型为 int64
- question: 数据类型为 string
- human_annotation: 数据类型为 string
- gpt4_ha_answer: 数据类型为 string
- category: 数据类型为 string
- task_name: 数据类型为 string
- image_input: 数据类型为 image

数据分割

分割名称: test
- 字节数: 100776921.0
- 样本数量: 908

数据大小

下载大小: 51714254
数据集大小: 100776921.0

配置详情

配置名称: touchstone
- 数据文件:
  - 分割: test
  - 路径: touchstone/test-*

搜集汇总

数据集介绍

main_image_url

背景与挑战

背景概述

该数据集是一个多模态公共基准集合，包含图像和文本数据，主要用于评估多模态大语言模型。数据集涵盖视觉识别、数学问题求解、情感识别等多种任务类型，共908行测试数据，适用于模型性能的随机采样和基准测试。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集

© 2023-2025 上海数据发展科技有限责任公司版权所有

沪ICP备17003045号-15 沪公网安备31010402336585号

二维码

社区交流群

面向社区/商业的数据集话题

二维码

科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作