MiaoMiaoYang/OpenMMlo
收藏Hugging Face2024-06-07 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/MiaoMiaoYang/OpenMMlo
下载链接
链接失效反馈官方服务:
资源简介:
OpenMMlo数据集是为了研究长尾开放世界对多模态大语言模型(MLLMs)的影响而构建的。该数据集通过扩展开源数据集ImageNet-LT、iNaturalist2018和Places-LT来创建。ImageNet-LT包含1,000个类别和115.8k样本,Places-LT包含365个类别和184.5k样本,iNaturalist2018包含8,142个类别和437.5k样本。数据集使用InstructBLIP生成图像的详细描述,提示词为“这张图片描述了什么?请详细描述其大小、位置、颜色及其与周围环境的关系。”
OpenMMlo数据集是为了研究长尾开放世界对多模态大语言模型(MLLMs)的影响而构建的。该数据集通过扩展开源数据集ImageNet-LT、iNaturalist2018和Places-LT来创建。ImageNet-LT包含1,000个类别和115.8k样本,Places-LT包含365个类别和184.5k样本,iNaturalist2018包含8,142个类别和437.5k样本。数据集使用InstructBLIP生成图像的详细描述,提示词为“这张图片描述了什么?请详细描述其大小、位置、颜色及其与周围环境的关系。”
提供机构:
MiaoMiaoYang
原始信息汇总
数据集概述
数据集名称
OpenMMlo
数据集目的
研究长尾开放世界对多模态大型语言模型(MLLMs)的影响。
数据集构建
- 来源数据集:
- ImageNet-LT: 包含1,000个类别,共115.8k样本,每个类别样本数从5到1,280不等,还包括18k用于OOD检测的图像。
- iNaturalist 2018: 包含8,142个类别,共437.5k样本。
- Places-LT: 包含365个类别,共184.5K样本,每个类别样本数从5到4,980不等。
- 数据处理: 使用InstructBLIP生成图像的相关描述,描述内容包括大小、位置、颜色及其与周围环境的关系。
数据集特征
- 类别分布: 长尾分布,类别样本数差异大。
- 模态: 多模态,包括视觉和语言信息。
数据集规模
- 样本数量: 100K<n<1M
许可证
- 许可证类型: cc-by-nc-sa-4.0
语言
- 数据集语言: 英语
标签
- 相关标签:
- 视觉语言模型
- MLLM
- 多模态大型语言模型
- 长尾
- OOD



