five

dSprites

收藏
github2020-02-25 更新2024-05-31 收录
下载链接:
https://github.com/tik0/dsprites-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
dSprites是一个用于评估无监督学习方法解耦特性的数据集,包含2D形状,由6个基础的独立潜在因素生成,这些因素包括颜色、形状、比例、旋转以及x和y位置。数据集共有737280张图像,每张图像都是这些潜在因素的唯一组合。

dSprites is a dataset designed for evaluating the disentanglement properties of unsupervised learning methods. It comprises 2D shapes generated from six fundamental independent latent factors, including color, shape, scale, rotation, and x and y positions. The dataset contains a total of 737,280 images, each representing a unique combination of these latent factors.
创建时间:
2019-12-15
原始信息汇总

dSprites数据集概述

数据集名称:dSprites - Disentanglement testing Sprites dataset

目的:用于评估无监督学习方法的解耦特性。

数据集组成

  • 图像数量:737,280张
  • 图像尺寸:64x64像素,黑白图像
  • 潜在因素:6个,包括颜色、形状、比例、旋转、x位置和y位置
  • 潜在因素值
    • 颜色:白色
    • 形状:正方形、椭圆、心形
    • 比例:6个值,线性分布在[0.5, 1]
    • 旋转:40个值,范围在[0, 2π]
    • x位置:32个值,范围在[0, 1]
    • y位置:32个值,范围在[0, 1]

数据格式

  • imgs:(737,280 x 64 x 64, uint8)
  • latents_values:(737,280 x 6, float64)
  • latents_classes:(737,280 x 6, int64)
  • metadata:包含额外信息,包括可能的潜在值

数据集用途:用于评估模型恢复上述基本真实潜在因素的能力,以及解耦质量的度量。

引用方式: bibtex @misc{dsprites17, author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner}, title = {dSprites: Disentanglement testing Sprites dataset}, howpublished= {https://github.com/deepmind/dsprites-dataset/}, year = "2017", }

搜集汇总
数据集介绍
main_image_url
构建方式
dSprites数据集是由六个独立的底层因素(颜色、形状、大小、方向、X位置、Y位置)生成的二维形状组成的,通过系统地变化每个潜在变量并存储固定顺序的图像,确保了所有潜在变量组合的唯一性,共形成了737280个图像。数据集的构建旨在评估无监督学习方法的解耦性质,每个潜在变量的变化都经过精心设计,以最小化步进变化同时保证像素输出的差异性。
特点
dSprites数据集的主要特点在于其图像是由可控的潜在变量生成的,且每个潜在变量都有明确的数值范围和分类索引。这为评估模型的解耦质量提供了一个理想的测试平台。数据集包含所有潜在变量组合的图像,并且图像顺序允许反向映射到相应的潜在变量值。此外,数据集以NPZ和HDF5格式提供,包含了图像数据、潜在变量的数值和分类索引,以及额外的元数据信息。
使用方法
使用dSprites数据集时,研究者可以依据数据集提供的潜在变量数值和分类索引进行模型的训练和评估。数据集的结构使得研究者能够轻松地追踪模型对潜在变量解耦的能力。此外,社区还提出了一个解耦质量评估指标,可供研究者参考以评估其模型的性能。在使用本数据集的研究中,应正确引用数据集的来源,以遵守学术规范。
背景与挑战
背景概述
dSprites数据集,由Loic Matthey、Irina Higgins、Demis Hassabis和Alexander Lerchner等于2017年创建,旨在评估无监督学习方法解耦特性的测试。该数据集包含了从六个独立潜在因子(颜色、形状、大小、方向、X位置和Y位置)程序生成的二维形状图像。dSprites数据集的构建,不仅为研究提供了一个理想的测试平台,而且对于推动视觉概念学习框架的发展具有重要影响力。
当前挑战
dSprites数据集在构建和应用过程中面临的挑战主要包括:如何精确地量化模型解耦质量,以及如何在保证图像差异性的同时维持潜在因子的细微变化。此外,该数据集在用于模型评估时,如何确保模型的泛化能力以及准确反映真实世界场景的解耦特性,也是当前研究者和工程师需要深入探讨的问题。
常用场景
经典使用场景
在深度学习和表征学习领域,dSprites数据集被广泛用于评估无监督学习方法的解耦特性。该数据集通过提供具有明确独立潜在因子的二维形状,成为测试模型是否能够有效学习到这些因子并解耦它们的标准平台。
解决学术问题
dSprites数据集解决了无监督学习中如何评估模型解耦能力的难题,为研究者提供了一种可靠的度量方式,即通过比较模型恢复的潜在因子与地面真实潜在因子的相似度,从而推动了表征学习领域的发展。
衍生相关工作
dSprites数据集催生了一系列相关研究工作,例如beta-VAE等变分框架的提出,这些工作在约束变分框架下学习基本视觉概念,为表征学习和无监督学习领域贡献了新的理论和方法。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作