five

MiaoMiaoYang/OpenMMlo

收藏
Hugging Face2024-06-07 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/MiaoMiaoYang/OpenMMlo
下载链接
链接失效反馈
官方服务:
资源简介:
OpenMMlo数据集是为了研究长尾开放世界对多模态大语言模型(MLLMs)的影响而构建的。该数据集通过扩展开源数据集ImageNet-LT、iNaturalist2018和Places-LT来创建。ImageNet-LT包含1,000个类别和115.8k样本,Places-LT包含365个类别和184.5k样本,iNaturalist2018包含8,142个类别和437.5k样本。数据集使用InstructBLIP生成图像的详细描述,提示词为“这张图片描述了什么?请详细描述其大小、位置、颜色及其与周围环境的关系。”

OpenMMlo数据集是为了研究长尾开放世界对多模态大语言模型(MLLMs)的影响而构建的。该数据集通过扩展开源数据集ImageNet-LT、iNaturalist2018和Places-LT来创建。ImageNet-LT包含1,000个类别和115.8k样本,Places-LT包含365个类别和184.5k样本,iNaturalist2018包含8,142个类别和437.5k样本。数据集使用InstructBLIP生成图像的详细描述,提示词为“这张图片描述了什么?请详细描述其大小、位置、颜色及其与周围环境的关系。”
提供机构:
MiaoMiaoYang
原始信息汇总

数据集概述

数据集名称

OpenMMlo

数据集目的

研究长尾开放世界对多模态大型语言模型(MLLMs)的影响。

数据集构建

  • 来源数据集:
    • ImageNet-LT: 包含1,000个类别,共115.8k样本,每个类别样本数从5到1,280不等,还包括18k用于OOD检测的图像。
    • iNaturalist 2018: 包含8,142个类别,共437.5k样本。
    • Places-LT: 包含365个类别,共184.5K样本,每个类别样本数从5到4,980不等。
  • 数据处理: 使用InstructBLIP生成图像的相关描述,描述内容包括大小、位置、颜色及其与周围环境的关系。

数据集特征

  • 类别分布: 长尾分布,类别样本数差异大。
  • 模态: 多模态,包括视觉和语言信息。

数据集规模

  • 样本数量: 100K<n<1M

许可证

  • 许可证类型: cc-by-nc-sa-4.0

语言

  • 数据集语言: 英语

标签

  • 相关标签:
    • 视觉语言模型
    • MLLM
    • 多模态大型语言模型
    • 长尾
    • OOD
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作