Voxel51/Describable-Textures-Dataset
收藏Hugging Face2024-05-06 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Voxel51/Describable-Textures-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
Describable Textures Dataset(DTD)是一个纹理数据库,包含5640张图像,分为47个类别,每个类别有120张图像。图像大小在300x300到640x640之间,且至少90%的图像表面代表类别属性。数据集分为训练、验证和测试三部分,每部分每个类别包含40张图像。数据集的创建旨在支持图像理解中的纹理描述,通过语义属性描述纹理。数据集图像来源于Google和Flickr,并通过Amazon Mechanical Turk进行标注。
Describable Textures Dataset(DTD)是一个纹理数据库,包含5640张图像,分为47个类别,每个类别有120张图像。图像大小在300x300到640x640之间,且至少90%的图像表面代表类别属性。数据集分为训练、验证和测试三部分,每部分每个类别包含40张图像。数据集的创建旨在支持图像理解中的纹理描述,通过语义属性描述纹理。数据集图像来源于Google和Flickr,并通过Amazon Mechanical Turk进行标注。
提供机构:
Voxel51
原始信息汇总
Describable Textures Dataset 概述
数据集基本信息
- 名称: Describable Textures Dataset
- 样本数量: 5640
- 语言: 英语
- 许可证: 其他
- 大小: 1K<n<10K
- 任务类别: 图像分类
- 标签: fiftyone, 图像, 图像分类
数据集描述
Describable Textures Dataset (DTD) 是一个包含5640张图像的纹理数据库,这些图像根据人类感知的47个术语(类别)进行组织。每个类别包含120张图像,图像尺寸在300x300到640x640之间,并且至少90%的表面代表该类别属性。图像通过在Google和Flickr上使用提议的属性和相关术语作为搜索查询收集而来,并通过Amazon Mechanical Turk进行多轮标注。数据集分为训练、验证和测试三个等份,每个类别每部分包含40张图像。此外,还提供了关键属性和联合属性的地面实况标注,以及用于评估的10个数据分割。
数据集来源
- 主页: https://www.robots.ox.ac.uk/~vgg/data/dtd/
- 论文: https://www.robots.ox.ac.uk/~vgg/publications/2014/Cimpoi14/cimpoi14.pdf
- 演示: https://try.fiftyone.ai/datasets/describable-textures-dataset/samples
数据集创建
- 创建理由: 为了支持图像理解中的纹理描述,该数据集旨在使用语义属性描述纹理。确定了47个纹理术语,并用于描述从野外收集的大量纹理模式。
- 源数据: Google和Flickr
引用信息
bibtex @InProceedings{cimpoi14describing, Author = {M. Cimpoi and S. Maji and I. Kokkinos and S. Mohamed and and A. Vedaldi}, Title = {Describing Textures in the Wild}, Booktitle = {Proceedings of the {IEEE} Conf. on Computer Vision and Pattern Recognition ({CVPR})}, Year = {2014}}
搜集汇总
数据集介绍

构建方式
该数据集由5640张图像组成,这些图像根据47个源自人类感知的术语(类别)进行组织。每类包含120张图像,尺寸介于300x300至640x640像素之间,且图像中至少90%的表面代表该类别属性。图像通过Google和Flickr收集,使用提议的属性及相关术语作为搜索查询。图像通过Amazon Mechanical Turk进行多轮注释,每张图像提供主要类别和联合属性列表。数据集被分为训练、验证和测试三部分,每部分每类包含40张图像,并提供关键和联合属性的真实标注及10种数据分割用于评估。
特点
该数据集的主要特点在于其丰富的纹理描述和多样的视觉印象,涵盖了从自然到人工的各种纹理模式。每张图像不仅标注了主要类别,还提供了联合属性列表,增强了数据集的多维度和深度。此外,数据集的分割设计确保了在不同评估场景下的可靠性和广泛适用性。
使用方法
使用该数据集前,需安装FiftyOne库。通过Python代码,用户可以加载数据集并启动应用程序进行可视化分析。加载数据集时,可选择性设置最大样本数等参数。数据集的加载和应用过程简便,适合用于图像分类和纹理分析等任务。
背景与挑战
背景概述
在计算机视觉领域,描述性纹理数据集(Describable Textures Dataset, DTD)的创建旨在模拟人类视觉系统对图像内容的生动描述能力。该数据集由M. Cimpoi、S. Maji、I. Kokkinos、S. Mohamed和A. Vedaldi等研究人员于2012年在约翰斯·霍普金斯大学语言与语音处理中心(CLSP)夏季研讨会上启动,并得到了NSF Grant #1005411、JHU-HLTCOE、Google Research、ERC grant VisRec no. 228180和ANR-10-JCJC-0205的支持。DTD包含5640张图像,分为47个类别,每个类别有120张图像,图像尺寸介于300x300至640x640之间。该数据集通过Google和Flickr收集,并使用Amazon Mechanical Turk进行多轮注释,旨在为机器提供对纹理的语义描述能力,从而推动纹理分析技术的发展。
当前挑战
DTD数据集在构建过程中面临多项挑战。首先,如何从海量网络图像中筛选出符合特定纹理描述的图像,确保数据集的多样性和代表性,是一个复杂的过程。其次,通过Amazon Mechanical Turk进行图像注释时,如何确保注释的一致性和准确性,避免人为误差,也是一个重要问题。此外,数据集的划分(训练、验证和测试集)需要精心设计,以确保模型训练的有效性和泛化能力。最后,如何有效地将这些纹理描述转化为机器可理解的特征表示,以支持纹理识别和分类任务,是该数据集在实际应用中的核心挑战。
常用场景
经典使用场景
在计算机视觉领域,Voxel51/Describable-Textures-Dataset 被广泛用于图像纹理分类任务。该数据集包含5640张图像,涵盖47种不同的纹理类别,每类有120张图像。通过这些图像,研究人员可以训练和评估纹理识别模型,探索如何使机器能够像人类一样描述和区分不同的纹理特征。
解决学术问题
该数据集解决了传统纹理分析中缺乏丰富语义描述的问题。通过提供47种基于人类感知的纹理类别,它促进了纹理识别技术的发展,并为研究纹理信息的处理、分析和表示提供了新的视角。这不仅提升了纹理识别的准确性,还为智能系统在视觉感知方面的研究开辟了新的方向。
衍生相关工作
基于Voxel51/Describable-Textures-Dataset,许多研究工作得以展开。例如,Cimpoi等人(2014)在其论文中详细探讨了如何利用该数据集进行纹理描述和识别。此外,该数据集还激发了其他研究者开发新的纹理特征提取和分类算法,推动了计算机视觉领域在纹理分析方面的技术进步。
以上内容由遇见数据集搜集并总结生成



