Novel Visual Concept (NVC) dataset

github2019-07-15 更新2024-05-31 收录

下载链接：

https://github.com/afcarl/NVC-Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集提供了新颖视觉概念的标注和工具包，用于研究从图像句子描述中快速学习新颖视觉概念。数据集包含训练、验证和测试集的JSON文件，每个文件详细记录了图像和相关句子的信息。

This dataset provides annotations and toolkits for novel visual concepts, designed for researching the rapid learning of novel visual concepts from image-sentence descriptions. The dataset includes JSON files for training, validation, and test sets, each meticulously documenting the information of images and their associated sentences.

创建时间：

2018-06-15

原始信息汇总

Novel Visual Concept (NVC) Dataset Summary

Overview

The Novel Visual Concept (NVC) dataset provides annotations and a simple toolkit for research purposes. It includes images and pre-calculated VggNet layer 15 image features, which can be downloaded by running setup.sh.

Dataset Structure

Annotations: Two JSON files located in the ./annotations directory:
- One for the training and validation set.
- One for the testing set.

JSON File Structure

Root: A key-value dictionary containing:
- version: Dataset version.
- concepts: List of novel visual concepts.
- images: List of dictionaries, each containing:
  - concept: Novel concepts for the image.
  - image_id: Unique image identifier.
  - image_name: File name of the image.
  - train_val_test_split: train, val, or test.
  - sentences: List of dictionaries, each containing:
    - raw: Raw annotated sentence.
    - tokens: Tokenized sentence without the period.
    - sentence_id: Unique sentence identifier.
    - image_id: Unique image identifier the sentence belongs to.

License

The annotations in the dataset are licensed under a Creative Commons Attribution 4.0 License. The dataset is a collaboration between the University of California, Los Angeles, and Baidu Research.

搜集汇总

数据集介绍

构建方式

Novel Visual Concept (NVC)数据集的构建，旨在模拟儿童如何快速从图像的句子描述中学习新的视觉概念。该数据集通过收集图像及其对应的句子描述，并使用VggNet层15的预计算图像特征，为每一幅图像提供了独特的视觉概念标签，从而构建了一个综合性的学习资源。

特点

NVC数据集的特点在于它专注于新颖视觉概念的学习，其数据格式包含两个JSON文件，分别用于训练验证集和测试集。每个JSON文件都详尽地记录了数据集版本、视觉概念列表以及图像信息，包括图像的唯一标识符、概念标签、文件名和训练验证测试的划分，还提供了与图像相关的句子描述及其分词。

使用方法

使用NVC数据集，首先需要运行setup.sh脚本来下载图像和预计算的VggNet图像特征。用户可以通过NVC_dataset_demo.ipynb或NVC_dataset_demo.py来探索数据集。若在打开NVC_dataset_demo.ipynb时遇到“bad request”错误，建议更新ipython或选择运行NVC_dataset_demo.py。此外，使用该数据集的研究应遵循Creative Commons Attribution 4.0 License，并在研究中引用相关论文。

背景与挑战

背景概述

Novel Visual Concept (NVC)数据集源于对儿童快速学习新视觉概念能力的研究，由UCLA的Junhua Mao等研究人员于2015年提出。该数据集旨在探索机器如何模拟儿童从图像及其句子描述中快速学习新视觉概念的过程，对计算机视觉领域中的图像理解与生成模型训练具有重要影响。数据集包含了根据句子描述对图像进行标注的注释，以及对应的图像和预计算的VggNet图像特征，为相关研究提供了丰富的实验资源。

当前挑战

NVC数据集在构建过程中面临了多项挑战，其中包括确保句子描述与图像内容的高度相关性，以及如何精确地标注和量化视觉概念。此外，该数据集在解决图像理解领域的挑战时，需要应对如何有效模拟儿童学习机制的问题，包括快速适应新概念和从有限描述中提取丰富信息的能力。构建过程中的挑战还包括了数据集的多样性和规模，以及如何平衡数据标注的质量与效率。

常用场景

经典使用场景

在儿童学习与视觉认知研究领域，Novel Visual Concept (NVC) 数据集被广泛应用于模拟儿童如何从图像及其句子描述中快速学习新视觉概念。该数据集通过提供图像、描述句子及其对应的新视觉概念标注，为研究人员提供了一个探讨机器学习模型在类似情境下学习能力的平台。

实际应用

在实用层面，NVC 数据集的应用场景包括智能教育系统、辅助视觉障碍人士的辅助系统、以及图像描述生成等领域。这些系统可利用该数据集进行训练，从而提高对新颖视觉概念的识别和理解能力。

衍生相关工作

基于NVC 数据集，研究者们已经衍生出一系列相关工作，包括对学习算法的改进、对新视觉概念学习理论的深入研究，以及将该数据集应用于不同类型的视觉认知任务中，进一步拓宽了该数据集的应用范围和影响力。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集