CLEVR|视觉推理数据集|自然语言处理数据集
收藏CLEVR 数据集概述
数据集描述
- 名称: CLEVR 数据集
- 目的: 用于诊断组合语言和基本视觉推理能力
- 来源: 由Justin Johnson, Bharath Hariharan, Laurens van der Maaten, Fei-Fei Li, C Lawrence Zitnick, Ross Girshick 在CVPR 2017上提出
数据集生成
- 图像生成: 使用Blender渲染合成图像,并输出包含每张图像场景信息的JSON文件。
- 问题生成: 根据图像的场景信息生成问题、功能程序和答案,输出包含所有问题的JSON文件。
数据集内容示例
- 图像示例: 展示了几张合成图像,如
images/img1.png
至images/img6.png
。 - 问题与答案示例:
- Q: 有多少个小球体?
- A: 2
- Q: 有多少个立方体是小物体或红色金属物体?
- A: 2
- Q: 金属球体和金属圆柱的颜色是否相同?
- A: 是
- Q: 小圆柱是否比金属物体多?
- A: 否
- Q: 在大黄色物体后面的蓝色球右侧是否有一个闪亮的立方体?
- A: 是
引用信息
@inproceedings{johnson2017clevr, title={CLEVR: A Diagnostic Dataset for Compositional Language and Elementary Visual Reasoning}, author={Johnson, Justin and Hariharan, Bharath and van der Maaten, Laurens and Fei-Fei, Li and Zitnick, C Lawrence and Girshick, Ross}, booktitle={CVPR}, year={2017} }

LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
中国光伏电站空间分布ChinaPV数据集(2015,2020年)
该数据集是中国光伏电站空间分布ChinaPV数据,数据时间为2015和2020年。该数据集以Landsat-8卫星影像为数据源,处理方法是基于GEE遥感云计算平台,运用随机森林分类模型对2020年中国光伏电站进行遥感提取,后经过形态学运算,灯光数据滤除,轮廓细化及目视解译等后处理操作生成。该数据详细描述了中国区域内每个光伏电站的面积和地理位置信息,反映了中国地区光伏电站发展现状及其地域分布规律,以ESRI Shapefile格式存储。
国家地球系统科学数据中心 收录
YOLO Drone Detection Dataset
为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。
github 收录
风电预测数据集
全球能源预测大赛(Global Energy Forecasting Competition ) 2012 - 风力发电赛道 所用数据集.
AI_Studio 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录