csd100

Name: csd100
Creator: Qualcomm
Published: 2025-11-28 19:52:45
License: 暂无描述

Hugging Face2025-11-28 更新2025-11-29 收录

下载链接：

https://huggingface.co/datasets/qualcomm/csd100

下载链接

链接失效反馈

官方服务：

资源简介：

CSD-100数据集包含100张图像，专为内容风格分解任务设计。图像内容多样，包括动物、机器人、乐器、水果、家具等类型。数据集通过从内容提示和风格提示中生成图像，并经过人工筛选得到。

提供机构：

Qualcomm

创建时间：

2025-11-28

原始信息汇总

CSD-100数据集概述

数据集简介

CSD-100是一个专门为内容-风格分解任务设计的评估数据集，包含100张图像。该数据集通过解耦单张图像的内容和风格，支持内容重定位和风格化应用，为视觉合成提供更大的创作灵活性。

数据集描述

样本数量: 100个独特样本
内容范围: 涵盖动物、机器人、乐器、水果、家具等多种内容-风格类型
数据格式: JPG格式图像，高度1024像素，宽度1024像素

数据集详情

属性	规格
总大小	7 MB
训练集大小	不适用
测试集大小	100张图像
验证集大小	不适用
输入样本	图像
标签	合成图像

数据收集流程

从RB-Modulation获取400个内容提示和100个风格提示
过滤模糊内容术语，保留180个内容和全部风格概念
使用Flux-Schnell生成约18,000张"<内容>在<风格>中"图像
人工筛选1,000张代表性图像，最终精选100个高质量样本

文件结构

压缩包包含100个目录，目录命名格式为{内容}+{风格}
每个目录对应一个测试样本，包含单张JPG图像
所有图像文件名均为00.jpg

使用许可

用途限制: 仅限研究用途
许可证类型: 其他许可证
许可证名称: license
许可证链接: LICENSE

引用规范

bibtex @article{nguyen2025csd, title = {CSD-VAR: Content-Style Decomposition in Visual Autoregressive Models}, author = {Nguyen, Quang-Binh and Luu, Minh and Nguyen, Quang and Tran, Anh and Nguyen, Khoi}, journal = {arXiv preprint arXiv:2507.13984}, year = {2025} }

数据来源

发布机构: Qualcomm AI Research
技术支持: research.datasets@qti.qualcomm.com

搜集汇总

数据集介绍

构建方式

在视觉合成领域，内容-风格解耦任务对评估数据提出了更高要求。该数据集构建始于从RB-Modulation获取的400个内容提示与100个风格提示，经过语义模糊性筛选后保留180个内容概念及全部风格要素。借助Flux-Schnell生成系统，通过<内容>+<风格>的文本组合生成了约1.8万幅初始图像，经人工筛选出1000幅代表性样本后，最终精炼为100组高质量图像，每个样本均以{内容}+{风格}的目录结构存储。

特点

作为专门针对内容-风格解耦任务的评估基准，该数据集囊括了动物、机器人、乐器等多元主题的100组测试样本。所有图像均采用1024×1024像素的高清JPG格式，通过严谨的语义筛选与人工标注流程，确保了内容与风格要素的典型性与区分度。数据集以目录化结构组织，每个独立样本对应明确的内容风格组合，为量化评估模型解耦能力提供了标准化测试环境。

使用方法

研究者可通过解压数据集压缩包获取100个独立目录，每个目录包含单张00.jpg格式测试图像。在实验设计时，建议将图像输入内容-风格解耦模型，分别提取其内容表征与风格特征，进而通过特征重组实现视觉元素的重新语境化。该数据集适用于定量评估生成模型的解耦性能，使用时需遵循研究用途许可协议，并在学术成果中引用相关论文以保障学术规范性。

背景与挑战

背景概述

在视觉合成领域，内容与风格的解耦作为关键研究方向，旨在实现图像语义要素与艺术特征的分离与重组。CSD-100数据集由高通人工智能研究院于2025年推出，聚焦于内容-风格分解任务，通过精心设计的100幅样本图像，填补了传统风格迁移数据集在双向解耦评估方面的空白。该数据集通过系统化生成流程构建，涵盖动物、器械、家具等多维度视觉概念，为视觉自回归模型的研究提供了基准测试基础。

当前挑战

内容-风格分解任务面临双重挑战：在技术层面需突破单图像中抽象特征与具象元素的纠缠难题，传统方法往往难以平衡风格化强度与内容保真度；在数据构建过程中，研究团队从初始400组内容提示中筛选出180组非歧义语义单元，并通过多轮人工遴选从1.8万张生成图像中提炼出100个高质量样本，这种精细化的数据蒸馏机制有效保障了评估集的代表性与可靠性。

常用场景

经典使用场景

在视觉内容生成领域，CSD-100数据集被广泛用于评估内容与风格的解耦能力。该数据集通过精心设计的100幅图像样本，覆盖了动物、机器人、乐器等多样化主题，为研究者提供了标准化的测试基准。其核心应用在于验证模型能否准确分离图像中的结构性内容与艺术性风格，进而支持生成式模型的性能比较与优化。

衍生相关工作

围绕该数据集衍生的经典研究包括CSD-VAR等视觉自回归模型框架。这些工作通过引入分层表征机制，实现了对内容与风格要素的精细化建模。后续研究进一步拓展了动态风格插值、多模态内容编辑等方向，形成了以解耦学习为核心的技术脉络，持续推动着生成式人工智能在视觉合成领域的发展。

数据集最近研究