Novel Visual Concept (NVC) dataset|视觉学习数据集|概念识别数据集

github2019-07-15 更新2024-05-31 收录

视觉学习

概念识别

下载链接：

https://github.com/afcarl/NVC-Dataset

下载链接

链接失效反馈

资源简介：

该数据集提供了新颖视觉概念的标注和工具包，用于研究从图像句子描述中快速学习新颖视觉概念。数据集包含训练、验证和测试集的JSON文件，每个文件详细记录了图像和相关句子的信息。

This dataset provides annotations and toolkits for novel visual concepts, designed for researching the rapid learning of novel visual concepts from image-sentence descriptions. The dataset includes JSON files for training, validation, and test sets, each meticulously documenting the information of images and their associated sentences.

创建时间：

2018-06-15

原始信息汇总

Novel Visual Concept (NVC) Dataset Summary

Overview

The Novel Visual Concept (NVC) dataset provides annotations and a simple toolkit for research purposes. It includes images and pre-calculated VggNet layer 15 image features, which can be downloaded by running setup.sh.

Dataset Structure

Annotations: Two JSON files located in the ./annotations directory:
- One for the training and validation set.
- One for the testing set.

JSON File Structure

Root: A key-value dictionary containing:
- version: Dataset version.
- concepts: List of novel visual concepts.
- images: List of dictionaries, each containing:
  - concept: Novel concepts for the image.
  - image_id: Unique image identifier.
  - image_name: File name of the image.
  - train_val_test_split: train, val, or test.
  - sentences: List of dictionaries, each containing:
    - raw: Raw annotated sentence.
    - tokens: Tokenized sentence without the period.
    - sentence_id: Unique sentence identifier.
    - image_id: Unique image identifier the sentence belongs to.

License

The annotations in the dataset are licensed under a Creative Commons Attribution 4.0 License. The dataset is a collaboration between the University of California, Los Angeles, and Baidu Research.

AI搜集汇总

数据集介绍

构建方式

Novel Visual Concept (NVC)数据集的构建，旨在模拟儿童如何快速从图像的句子描述中学习新的视觉概念。该数据集通过收集图像及其对应的句子描述，并使用VggNet层15的预计算图像特征，为每一幅图像提供了独特的视觉概念标签，从而构建了一个综合性的学习资源。

特点

NVC数据集的特点在于它专注于新颖视觉概念的学习，其数据格式包含两个JSON文件，分别用于训练验证集和测试集。每个JSON文件都详尽地记录了数据集版本、视觉概念列表以及图像信息，包括图像的唯一标识符、概念标签、文件名和训练验证测试的划分，还提供了与图像相关的句子描述及其分词。

使用方法

使用NVC数据集，首先需要运行setup.sh脚本来下载图像和预计算的VggNet图像特征。用户可以通过NVC_dataset_demo.ipynb或NVC_dataset_demo.py来探索数据集。若在打开NVC_dataset_demo.ipynb时遇到“bad request”错误，建议更新ipython或选择运行NVC_dataset_demo.py。此外，使用该数据集的研究应遵循Creative Commons Attribution 4.0 License，并在研究中引用相关论文。

背景与挑战

背景概述

Novel Visual Concept (NVC)数据集源于对儿童快速学习新视觉概念能力的研究，由UCLA的Junhua Mao等研究人员于2015年提出。该数据集旨在探索机器如何模拟儿童从图像及其句子描述中快速学习新视觉概念的过程，对计算机视觉领域中的图像理解与生成模型训练具有重要影响。数据集包含了根据句子描述对图像进行标注的注释，以及对应的图像和预计算的VggNet图像特征，为相关研究提供了丰富的实验资源。

当前挑战

NVC数据集在构建过程中面临了多项挑战，其中包括确保句子描述与图像内容的高度相关性，以及如何精确地标注和量化视觉概念。此外，该数据集在解决图像理解领域的挑战时，需要应对如何有效模拟儿童学习机制的问题，包括快速适应新概念和从有限描述中提取丰富信息的能力。构建过程中的挑战还包括了数据集的多样性和规模，以及如何平衡数据标注的质量与效率。

常用场景

经典使用场景

在儿童学习与视觉认知研究领域，Novel Visual Concept (NVC) 数据集被广泛应用于模拟儿童如何从图像及其句子描述中快速学习新视觉概念。该数据集通过提供图像、描述句子及其对应的新视觉概念标注，为研究人员提供了一个探讨机器学习模型在类似情境下学习能力的平台。

实际应用

在实用层面，NVC 数据集的应用场景包括智能教育系统、辅助视觉障碍人士的辅助系统、以及图像描述生成等领域。这些系统可利用该数据集进行训练，从而提高对新颖视觉概念的识别和理解能力。

衍生相关工作

基于NVC 数据集，研究者们已经衍生出一系列相关工作，包括对学习算法的改进、对新视觉概念学习理论的深入研究，以及将该数据集应用于不同类型的视觉认知任务中，进一步拓宽了该数据集的应用范围和影响力。

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性，12位男性)，以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情，歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常，强烈) 下产生的，另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位，48kHz .wav)，音频-视频 (720p H.264，AAC 48kHz，.mp4) 和仅视频 (无声音)。注意，Actor_18没有歌曲文件。

OpenDataLab 收录

Obstacle-dataset OD

该数据集用于十五种障碍物检测，包含VOC格式和YOLO训练的.txt文件，数据集中的图像来自VOC数据集、COCO数据集、TT100K数据集以及作者团队实地收集的图片。

github 收录

China Groundgroundwater Monitoring Network

该数据集包含中国地下水监测网络的数据，涵盖了全国范围内的地下水位、水质和相关环境参数的监测信息。数据包括但不限于监测站点位置、监测时间、水位深度、水质指标（如pH值、溶解氧、总硬度等）以及环境因素（如气温、降水量等）。

www.ngac.org.cn 收录

用于陆面模拟的中国土壤数据集（第二版）

本研究对中国范围内0-2米六个标准深度层（0-5、5-15、15-30、30-60、60-100和100-200厘米）的23种土壤物理和化学属性进行了90米空间分辨率的制图。该数据集源自第二次土壤普查的8979个土壤剖面，世界土壤信息服务的1540个土壤剖面，第一次全国土壤普查的76个土壤剖面，以及区域数据库的614个土壤剖面。该数据集包括pH值、砂粒、粉粒、粘粒、容重、有机碳含量、砾石、碱解氮、总氮、阳离子交换量、孔隙度、总钾、总磷、有效钾、有效磷和土壤颜色（包括蒙赛尔颜色和RGB两种形式）。数据集的缺失值为“fillvalue = -32768”。数据集以栅格格式提供，有Tiff和netCDF两种格式。为了满足陆面建模中不同应用对空间分辨率的不同要求，CSDLv2 提供了 90 米、1 公里和 10公里空间分辨率的版本。各个土壤属性的单位参见说明文档。该数据集相对于第一版具有更好的数据质量，可广泛应用于陆面过程模拟等地学相关研究。

国家青藏高原科学数据中心收录

MOOCs Dataset

该数据集包含了大规模开放在线课程（MOOCs）的相关数据，包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。