lmms-lab/NoCaps
收藏Hugging Face2024-03-08 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/lmms-lab/NoCaps
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是[NoCaps](https://nocaps.org/)的一个格式化版本,用于`lmms-eval`管道中以一键评估大型多模态模型。数据集包含图像及其相关元数据,如URL、捕获日期、文件名、尺寸、ID、许可证信息等,以及注释ID和注释标题。数据集分为验证集和测试集,分别包含4500和10600个样本。
该数据集是[NoCaps](https://nocaps.org/)的一个格式化版本,用于`lmms-eval`管道中以一键评估大型多模态模型。数据集包含图像及其相关元数据,如URL、捕获日期、文件名、尺寸、ID、许可证信息等,以及注释ID和注释标题。数据集分为验证集和测试集,分别包含4500和10600个样本。
提供机构:
lmms-lab
原始信息汇总
数据集概述
数据集信息
特征
- image: 图像数据
- image_coco_url: 图像的COCO URL,字符串类型
- image_date_captured: 图像捕获日期,字符串类型
- image_file_name: 图像文件名,字符串类型
- image_height: 图像高度,整数类型
- image_width: 图像宽度,整数类型
- image_id: 图像ID,整数类型
- image_license: 图像许可证,整数类型
- image_open_images_id: 图像的Open Images ID,字符串类型
- annotations_ids: 标注ID序列,整数类型
- annotations_captions: 标注标题序列,字符串类型
数据分割
- validation: 验证集,包含4500个样本,大小为1421862846字节
- test: 测试集,包含10600个样本,大小为3342844310字节
数据大小
- 下载大小: 4761076789字节
- 数据集大小: 4764707156字节
配置
- config_name: default
- data_files:
- validation: data/validation-*
- test: data/test-*
- data_files:
搜集汇总
数据集介绍

背景与挑战
背景概述
NoCaps是一个大规模多模态评估数据集,专注于新颖物体描述任务,包含图像和文本数据,用于评估多模态模型的性能。数据集格式为parquet,适用于lmms-eval评估流程。
以上内容由遇见数据集搜集并总结生成



