five

lmms-lab/NoCaps

收藏
Hugging Face2024-03-08 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/lmms-lab/NoCaps
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是[NoCaps](https://nocaps.org/)的一个格式化版本,用于`lmms-eval`管道中以一键评估大型多模态模型。数据集包含图像及其相关元数据,如URL、捕获日期、文件名、尺寸、ID、许可证信息等,以及注释ID和注释标题。数据集分为验证集和测试集,分别包含4500和10600个样本。

该数据集是[NoCaps](https://nocaps.org/)的一个格式化版本,用于`lmms-eval`管道中以一键评估大型多模态模型。数据集包含图像及其相关元数据,如URL、捕获日期、文件名、尺寸、ID、许可证信息等,以及注释ID和注释标题。数据集分为验证集和测试集,分别包含4500和10600个样本。
提供机构:
lmms-lab
原始信息汇总

数据集概述

数据集信息

特征

  • image: 图像数据
  • image_coco_url: 图像的COCO URL,字符串类型
  • image_date_captured: 图像捕获日期,字符串类型
  • image_file_name: 图像文件名,字符串类型
  • image_height: 图像高度,整数类型
  • image_width: 图像宽度,整数类型
  • image_id: 图像ID,整数类型
  • image_license: 图像许可证,整数类型
  • image_open_images_id: 图像的Open Images ID,字符串类型
  • annotations_ids: 标注ID序列,整数类型
  • annotations_captions: 标注标题序列,字符串类型

数据分割

  • validation: 验证集,包含4500个样本,大小为1421862846字节
  • test: 测试集,包含10600个样本,大小为3342844310字节

数据大小

  • 下载大小: 4761076789字节
  • 数据集大小: 4764707156字节

配置

  • config_name: default
    • data_files:
      • validation: data/validation-*
      • test: data/test-*
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
NoCaps是一个大规模多模态评估数据集,专注于新颖物体描述任务,包含图像和文本数据,用于评估多模态模型的性能。数据集格式为parquet,适用于lmms-eval评估流程。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作