MovingFashion
收藏Hugging Face2025-07-25 更新2025-07-26 收录
下载链接:
https://huggingface.co/datasets/christianjoppi/MovingFashion
下载链接
链接失效反馈官方服务:
资源简介:
MovingFashion数据集是一个面向视频到购物(video-to-shop)挑战的计算机视觉基准数据集,包含14855个来自社交媒体平台如Instagram、TikTok和Net-A-Porter的社会视频。每个视频都与一个或多个在线时尚零售商的高质量产品图片相关联,用于支持基于视频的时尚检索研究,并桥接动态社交媒体内容与静态电子商务目录之间的差距。
创建时间:
2025-07-23
原始信息汇总
MovingFashion数据集概述
数据集简介
MovingFashion是首个公开可用的基准数据集,旨在解决计算机视觉中的视频到商店挑战,目标是通过将社交媒体视频(如Instagram、TikTok)中穿着的时尚物品与相应的电子商务产品图像进行匹配来检索。
数据集详情
- 总视频数: 14,855个社交媒体视频
- 来源平台: Instagram、TikTok和Net-A-Porter
- 关联商店图像: 每个视频链接到一个或多个来自在线时尚零售商的高质量产品图像
- 用途: 支持基于视频的时尚检索研究,弥合动态社交媒体内容与静态电子商务目录之间的差距
主要特点
- 视频到商店匹配: 每个视频包含与相应商店图像匹配的时尚物品,便于检索任务。
- 多样化内容: 视频在光照、姿势、缩放级别和遮挡方面各不相同,反映了现实世界的挑战。
- 两种评估设置:
- 常规: 标准匹配条件
- 困难: 包括更具挑战性的场景,如遮挡、多人和复杂背景
应用领域
- 从社交媒体检索时尚物品
- 基于视频的推荐系统
- 电子商务与影响者内容的整合
- 领域适应和视频理解研究
引用信息
如果使用此数据集,请引用以下论文: bibtex @article{godi2021movingfashion, title={MovingFashion: a Benchmark for the Video-to-Shop Challenge}, author={Godi, Marco and Joppi, Christian and Skenderi, Geri and Cristani, Marco}, journal={arXiv preprint arXiv:2110.02627}, year={2021} }
许可证
- 许可证类型: cc-by-nc-4.0
搜集汇总
数据集介绍

构建方式
在时尚计算领域,MovingFashion数据集开创性地构建了视频与商品图像的跨模态关联框架。研究团队从Instagram、TikTok等主流社交平台及Net-A-Porter电商平台采集了14,855段时尚视频,通过人工标注将其与对应的高清商品图像建立精确匹配关系。这种构建方式充分考虑了现实场景中光照变化、人体姿态多样性等干扰因素,为视频到商店的检索任务建立了标准化基准。
特点
该数据集最显著的特征在于其真实场景的复杂性和评估体系的层次性。视频内容涵盖不同光照条件、多角度拍摄及部分遮挡等现实挑战,同时设置常规和困难两种评估模式,后者特别针对多人交互、复杂背景等极端场景进行测试。每个视频片段都与电商平台的标准商品图形成多模态对应,为跨域检索研究提供了丰富的对比素材。
使用方法
研究者可通过GitHub仓库获取数据集完整资源,按照标准协议开展非商业性研究。典型应用场景包括构建视频时尚检索系统时,可分别提取视频帧与商品图的深度特征进行相似度匹配;在电商推荐系统开发中,可利用该数据集训练跨模态对齐模型,实现社交媒体内容到商品页面的智能跳转。使用时应遵循论文规定的两种评估协议,确保结果可比性。
背景与挑战
背景概述
MovingFashion数据集由Humatics LAB团队于2021年推出,旨在解决计算机视觉领域中的视频到商店匹配问题。该数据集由Marco Godi等研究人员构建,包含来自Instagram、TikTok和Net-A-Porter平台的14,855个社交媒体视频,每个视频均关联一个或多个电子商务产品图像。作为首个公开的视频到商店匹配基准,MovingFashion填补了动态社交媒体内容与静态电子商务目录之间的研究空白,推动了视频理解、时尚检索和跨模态匹配等领域的发展。
当前挑战
MovingFashion数据集面临的核心挑战在于解决视频到商店匹配中的复杂场景问题。动态视频中的时尚物品常受到光照变化、姿态多样性、遮挡和复杂背景等因素的影响,增加了准确匹配的难度。数据构建过程中,研究人员需克服社交媒体视频与电子商务图像之间的领域差异,确保高质量标注。此外,数据集的硬评估设置进一步引入了多人场景和严重遮挡等现实挑战,对算法的鲁棒性和泛化能力提出了更高要求。
常用场景
经典使用场景
在时尚计算领域,MovingFashion数据集为视频到商店的检索任务提供了标准化的评估基准。该数据集通过社交媒体视频与电子商务产品图像的精确匹配,支持研究人员开发先进的跨模态检索算法。其多样化的视频内容涵盖了不同光照条件、姿态变化和遮挡场景,为算法鲁棒性测试提供了理想环境。
解决学术问题
该数据集有效解决了时尚检索中动态视频与静态商品图像间的语义鸿沟问题。通过提供大规模标注数据,促进了跨模态表征学习、领域自适应等关键技术的研究进展。特别在解决真实场景中的遮挡、多人交互等挑战性问题上,为计算机视觉社区提供了宝贵的实验数据。
衍生相关工作
基于该数据集的研究催生了多项创新成果,包括SEAM-Match-RCNN等跨模态匹配框架。这些工作通过改进时空特征提取与注意力机制,不断刷新视频到商店检索的性能上限。相关技术已被扩展应用于虚拟试衣、时尚趋势预测等衍生研究方向。
以上内容由遇见数据集搜集并总结生成



