Voxel51/Describable-Textures-Dataset

Name: Voxel51/Describable-Textures-Dataset
Creator: Voxel51
Published: 2024-05-06 17:34:23
License: 暂无描述

Hugging Face2024-05-06 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/Voxel51/Describable-Textures-Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

Describable Textures Dataset（DTD）是一个纹理数据库，包含5640张图像，分为47个类别，每个类别有120张图像。图像大小在300x300到640x640之间，且至少90%的图像表面代表类别属性。数据集分为训练、验证和测试三部分，每部分每个类别包含40张图像。数据集的创建旨在支持图像理解中的纹理描述，通过语义属性描述纹理。数据集图像来源于Google和Flickr，并通过Amazon Mechanical Turk进行标注。

提供机构：

Voxel51

原始信息汇总

Describable Textures Dataset 概述

数据集基本信息

名称: Describable Textures Dataset
样本数量: 5640
语言: 英语
许可证: 其他
大小: 1K<n<10K
任务类别: 图像分类
标签: fiftyone, 图像, 图像分类

数据集描述

Describable Textures Dataset (DTD) 是一个包含5640张图像的纹理数据库，这些图像根据人类感知的47个术语（类别）进行组织。每个类别包含120张图像，图像尺寸在300x300到640x640之间，并且至少90%的表面代表该类别属性。图像通过在Google和Flickr上使用提议的属性和相关术语作为搜索查询收集而来，并通过Amazon Mechanical Turk进行多轮标注。数据集分为训练、验证和测试三个等份，每个类别每部分包含40张图像。此外，还提供了关键属性和联合属性的地面实况标注，以及用于评估的10个数据分割。

数据集来源

主页: https://www.robots.ox.ac.uk/~vgg/data/dtd/
论文: https://www.robots.ox.ac.uk/~vgg/publications/2014/Cimpoi14/cimpoi14.pdf
演示: https://try.fiftyone.ai/datasets/describable-textures-dataset/samples

数据集创建

创建理由: 为了支持图像理解中的纹理描述，该数据集旨在使用语义属性描述纹理。确定了47个纹理术语，并用于描述从野外收集的大量纹理模式。
源数据: Google和Flickr

引用信息

bibtex @InProceedings{cimpoi14describing, Author = {M. Cimpoi and S. Maji and I. Kokkinos and S. Mohamed and and A. Vedaldi}, Title = {Describing Textures in the Wild}, Booktitle = {Proceedings of the {IEEE} Conf. on Computer Vision and Pattern Recognition ({CVPR})}, Year = {2014}}

搜集汇总

数据集介绍

构建方式

该数据集由5640张图像组成，这些图像根据47个源自人类感知的术语（类别）进行组织。每类包含120张图像，尺寸介于300x300至640x640像素之间，且图像中至少90%的表面代表该类别属性。图像通过Google和Flickr收集，使用提议的属性及相关术语作为搜索查询。图像通过Amazon Mechanical Turk进行多轮注释，每张图像提供主要类别和联合属性列表。数据集被分为训练、验证和测试三部分，每部分每类包含40张图像，并提供关键和联合属性的真实标注及10种数据分割用于评估。

特点

该数据集的主要特点在于其丰富的纹理描述和多样的视觉印象，涵盖了从自然到人工的各种纹理模式。每张图像不仅标注了主要类别，还提供了联合属性列表，增强了数据集的多维度和深度。此外，数据集的分割设计确保了在不同评估场景下的可靠性和广泛适用性。

使用方法

使用该数据集前，需安装FiftyOne库。通过Python代码，用户可以加载数据集并启动应用程序进行可视化分析。加载数据集时，可选择性设置最大样本数等参数。数据集的加载和应用过程简便，适合用于图像分类和纹理分析等任务。

背景与挑战

背景概述

在计算机视觉领域，描述性纹理数据集（Describable Textures Dataset, DTD）的创建旨在模拟人类视觉系统对图像内容的生动描述能力。该数据集由M. Cimpoi、S. Maji、I. Kokkinos、S. Mohamed和A. Vedaldi等研究人员于2012年在约翰斯·霍普金斯大学语言与语音处理中心（CLSP）夏季研讨会上启动，并得到了NSF Grant #1005411、JHU-HLTCOE、Google Research、ERC grant VisRec no. 228180和ANR-10-JCJC-0205的支持。DTD包含5640张图像，分为47个类别，每个类别有120张图像，图像尺寸介于300x300至640x640之间。该数据集通过Google和Flickr收集，并使用Amazon Mechanical Turk进行多轮注释，旨在为机器提供对纹理的语义描述能力，从而推动纹理分析技术的发展。

当前挑战

DTD数据集在构建过程中面临多项挑战。首先，如何从海量网络图像中筛选出符合特定纹理描述的图像，确保数据集的多样性和代表性，是一个复杂的过程。其次，通过Amazon Mechanical Turk进行图像注释时，如何确保注释的一致性和准确性，避免人为误差，也是一个重要问题。此外，数据集的划分（训练、验证和测试集）需要精心设计，以确保模型训练的有效性和泛化能力。最后，如何有效地将这些纹理描述转化为机器可理解的特征表示，以支持纹理识别和分类任务，是该数据集在实际应用中的核心挑战。

常用场景

经典使用场景

在计算机视觉领域，Voxel51/Describable-Textures-Dataset 被广泛用于图像纹理分类任务。该数据集包含5640张图像，涵盖47种不同的纹理类别，每类有120张图像。通过这些图像，研究人员可以训练和评估纹理识别模型，探索如何使机器能够像人类一样描述和区分不同的纹理特征。

解决学术问题

该数据集解决了传统纹理分析中缺乏丰富语义描述的问题。通过提供47种基于人类感知的纹理类别，它促进了纹理识别技术的发展，并为研究纹理信息的处理、分析和表示提供了新的视角。这不仅提升了纹理识别的准确性，还为智能系统在视觉感知方面的研究开辟了新的方向。

衍生相关工作

基于Voxel51/Describable-Textures-Dataset，许多研究工作得以展开。例如，Cimpoi等人（2014）在其论文中详细探讨了如何利用该数据集进行纹理描述和识别。此外，该数据集还激发了其他研究者开发新的纹理特征提取和分类算法，推动了计算机视觉领域在纹理分析方面的技术进步。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集