vogue-runway

Hugging Face2025-08-11 更新2025-08-12 收录

下载链接：

https://huggingface.co/datasets/traopia/vogue-runway

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是从Vogue网站抓取的关于时尚走秀的图像及其元数据。图像数据是通过clip-retrieval模型（ViT-B/32）生成的嵌入。元数据包括关键信息、设计师、季节、年份、城市、部分、宽度、高度、大小、审美和标签等。

This dataset consists of fashion runway images and their associated metadata, which were scraped from the Vogue website. The image data is represented as embeddings generated by the clip-retrieval model (ViT-B/32). The metadata covers key details including designers, seasons, years, cities, sections, width, height, file size, aesthetic attributes, tags, and other relevant information.

创建时间：

2025-08-06

原始信息汇总

数据集概述：traopia/vogue-runway

数据来源

数据集从Internet Archive导入，原始地址：https://archive.org/details/VogueRunway_dataset
数据抓取自Vogue网站，抓取时间：2023-03-31

文件内容

VogueRunway_image.npy
- 包含CLIP图像嵌入
- 使用clip-retrieval生成（ViT-B/32模型）
VogueRunway.parquet
- 表格形式元数据
- 包含列：key, designer, season, year, city, section, width, height, size, aesthetic, tags, url, filename

搜集汇总

数据集介绍

构建方式

vogue-runway数据集通过系统化爬取Vogue时尚平台的秀场资料构建而成，数据采集工作于2023年3月31日完成。原始数据来源于Internet Archive的公开存档，包含结构化元数据与视觉特征两个维度：元数据以parquet格式存储，涵盖设计师、季节、年份等12个字段；视觉特征采用CLIP的ViT-B/32模型生成图像嵌入向量，存储为numpy数组格式。这种多模态数据采集方式确保了时尚元素的语义与视觉特征得到完整保留。

特点

该数据集最显著的特点是实现了时尚领域多维度信息的有机整合。元数据部分精确记录了每张秀场图片的时空属性、设计品牌及美学标签，而CLIP嵌入向量则捕捉了图像的深层视觉语义。特别值得注意的是，数据集包含'aesthetic'和'tags'两个专业标注字段，为研究时尚风格演变提供了细粒度分析基础。不同年份、季节与城市维度的系统覆盖，使其成为研究时尚产业时空规律的理想样本库。

使用方法

研究者可结合元数据与视觉嵌入开展多模态分析，例如通过聚类算法验证特定设计师的风格一致性，或利用时间序列模型预测时尚趋势演变。图像嵌入可直接用于相似性检索，构建基于视觉语义的推荐系统。使用前需加载parquet文件获取结构化信息，配合numpy数组中的嵌入向量进行跨模态对齐。建议优先利用'section'和'aesthetic'字段进行数据筛选，以获得更具针对性的分析样本。

背景与挑战

背景概述

Vogue-runway数据集作为时尚领域的重要研究资源，由互联网档案馆于2023年3月31日从著名时尚杂志《Vogue》的走秀栏目中爬取并构建。该数据集聚焦于高端时尚设计的视觉分析与语义理解，核心研究问题涉及时尚趋势预测、设计师风格识别以及跨季节美学演变分析。数据集包含经过CLIP模型处理的图像嵌入特征和丰富的元数据信息，为计算机视觉与时尚计算的交叉研究提供了标准化基准。其独特价值在于将专业时尚领域的结构化标签与深度学习表征相结合，推动了时尚产业智能化分析的技术边界。

当前挑战

该数据集面临双重技术挑战：在领域问题层面，时尚图像的细粒度分类需要解决高度相似的服饰款式区分、跨年代风格迁移建模等难题，现有视觉模型对主观美学标签的泛化能力仍有不足。数据构建过程中，非标准化拍摄条件下的光照差异、模特姿态多样性导致特征对齐困难，而设计师命名体系的不一致性则增加了元数据清洗的复杂度。此外，CLIP模型对时尚专业术语的语义理解局限，使得生成嵌入与人工标注标签间存在表征鸿沟，这对多模态学习提出了更高要求。

常用场景

经典使用场景

在时尚产业与计算机视觉交叉领域，vogue-runway数据集为研究者提供了丰富的视觉与元数据资源。该数据集通过CLIP图像嵌入技术捕捉了Vogue秀场图像的深层语义特征，结合设计师、季节、城市等多维度标签，成为分析时尚趋势演变的理想基准。其典型应用包括构建时尚风格检索系统，研究者可通过跨模态检索实现从文本描述到视觉元素的精准映射。

衍生相关工作

该数据集催生了多个标志性研究，包括基于对比学习的时尚风格生成模型FashionCLIP，以及结合时空特征的趋势预测框架TrendForecaster。Meta等机构利用其多模态特性开发的视觉属性解耦方法，为可解释的时尚AI奠定了基准。部分衍生工作进一步扩展了原始数据，构建了包含消费者反馈的增强版本。

数据集最近研究