five

BennoKrojer/ImageCoDe

收藏
hugging_face2022-05-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/BennoKrojer/ImageCoDe
下载链接
链接失效反馈
资源简介:
ImageCoDe是一个视觉与语言理解的基准测试,要求理解语用学、时间性、长描述和视觉细微差别。该任务要求根据详细描述从10个最小对比图像中检索目标图像。数据集包含21K描述和94K图像,主要基于视频数据集的帧。
提供机构:
BennoKrojer
原始信息汇总

ImageCoDe数据集概述

数据集描述

  • 任务类型:视觉与语言基准,要求在给定详细描述的情况下,从10张最小对比度的图像中检索目标图像。
  • 数据内容:包含21,000个描述和94,000张图像,图像主要基于视频数据集的帧。

数据集结构

数据实例

每个实例包含以下信息:

  • 描述
  • 对应的图像集名称
  • 目标图像索引

示例:

{"image_set": "video-storytelling-videowedding_de8dLXvgV-I-shot6_0", "image_index": "8", "description": "The flowers the woman in the teal strapless dress is carrying are completely obscured by the man in the black shirts head. "}

数据分割

数据集分割 描述数量
训练集 16,594
验证集 2,302
测试集 2,306

数据集创建

精选理由

ImageCoDe旨在揭示近期视觉与语言模型在处理复杂语言和精细视觉表示方面的弱点。此外,该数据集提供了大量实用的示例,适合研究语用学。

用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Global Firepower Index (GFI)

Global Firepower Index (GFI) 是一个评估全球各国军事力量的综合指数。该指数考虑了超过50个因素,包括军事预算、人口、陆地面积、海军力量、空军力量、自然资源、后勤能力、地理位置等。数据集提供了每个国家的详细评分和排名,帮助分析和比较各国的军事实力。

www.globalfirepower.com 收录

PlantVillage

在这个数据集中,39 种不同类别的植物叶子和背景图像可用。包含 61,486 张图像的数据集。我们使用了六种不同的增强技术来增加数据集的大小。这些技术是图像翻转、伽玛校正、噪声注入、PCA 颜色增强、旋转和缩放。

OpenDataLab 收录

OQMD

12W+DFT计算数据,包括热力学和结构性质label

OpenDataLab 收录

IVLLab/MultiDialog

该数据集包含手动注释的元数据,将音频文件与转录、情感和其他属性链接起来。数据集支持多种任务,包括多模态对话生成、自动语音识别和文本到语音转换。数据集的语言为英语,并提供了一个黄金情感对话子集,用于研究对话中的情感动态。数据集的结构包括音频文件、对话ID、话语ID、来源、音频特征、转录文本、情感标签和原始路径等信息。

hugging_face 收录

大学生运动和体质健康数据集(2014-2023)

《大学生运动与体质健康数据集(2014-2023)》涵盖了大学生群体在运动能力、基础身体形态、身体机能及身体素质等多个方面的关键基础数据。该数据集的采集时间跨度为2014年至2023年,样本采集自全国34个省级行政区域,共计123281名大学生参与,平均年龄为20.53岁。建立大学生运动和体质健康数据集可以准确把握学生体质健康的整体水平和变化趋势,了解大学生运动和体质健康状况,对指导个性化健康干预、优化体育教育资源配置、支持促进科学研究以及提高公众健康意识等均具有重要意义。

国家人口健康科学数据中心 收录