BennoKrojer/ImageCoDe
收藏ImageCoDe数据集概述
数据集描述
- 任务类型:视觉与语言基准,要求在给定详细描述的情况下,从10张最小对比度的图像中检索目标图像。
- 数据内容:包含21,000个描述和94,000张图像,图像主要基于视频数据集的帧。
数据集结构
数据实例
每个实例包含以下信息:
- 描述
- 对应的图像集名称
- 目标图像索引
示例:
{"image_set": "video-storytelling-videowedding_de8dLXvgV-I-shot6_0", "image_index": "8", "description": "The flowers the woman in the teal strapless dress is carrying are completely obscured by the man in the black shirts head. "}
数据分割
数据集分割 | 描述数量 |
---|---|
训练集 | 16,594 |
验证集 | 2,302 |
测试集 | 2,306 |
数据集创建
精选理由
ImageCoDe旨在揭示近期视觉与语言模型在处理复杂语言和精细视觉表示方面的弱点。此外,该数据集提供了大量实用的示例,适合研究语用学。
Global Firepower Index (GFI)
Global Firepower Index (GFI) 是一个评估全球各国军事力量的综合指数。该指数考虑了超过50个因素,包括军事预算、人口、陆地面积、海军力量、空军力量、自然资源、后勤能力、地理位置等。数据集提供了每个国家的详细评分和排名,帮助分析和比较各国的军事实力。
www.globalfirepower.com 收录
PlantVillage
在这个数据集中,39 种不同类别的植物叶子和背景图像可用。包含 61,486 张图像的数据集。我们使用了六种不同的增强技术来增加数据集的大小。这些技术是图像翻转、伽玛校正、噪声注入、PCA 颜色增强、旋转和缩放。
OpenDataLab 收录
OQMD
12W+DFT计算数据,包括热力学和结构性质label
OpenDataLab 收录
IVLLab/MultiDialog
该数据集包含手动注释的元数据,将音频文件与转录、情感和其他属性链接起来。数据集支持多种任务,包括多模态对话生成、自动语音识别和文本到语音转换。数据集的语言为英语,并提供了一个黄金情感对话子集,用于研究对话中的情感动态。数据集的结构包括音频文件、对话ID、话语ID、来源、音频特征、转录文本、情感标签和原始路径等信息。
hugging_face 收录
大学生运动和体质健康数据集(2014-2023)
《大学生运动与体质健康数据集(2014-2023)》涵盖了大学生群体在运动能力、基础身体形态、身体机能及身体素质等多个方面的关键基础数据。该数据集的采集时间跨度为2014年至2023年,样本采集自全国34个省级行政区域,共计123281名大学生参与,平均年龄为20.53岁。建立大学生运动和体质健康数据集可以准确把握学生体质健康的整体水平和变化趋势,了解大学生运动和体质健康状况,对指导个性化健康干预、优化体育教育资源配置、支持促进科学研究以及提高公众健康意识等均具有重要意义。
国家人口健康科学数据中心 收录