five

jaddai/openbrush-baroque

收藏
Hugging Face2026-04-27 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/jaddai/openbrush-baroque
下载链接
链接失效反馈
官方服务:
资源简介:
OpenBrush Baroque数据集是OpenBrush-75K数据集的一个精选子集,专门聚焦于巴洛克艺术(约1600-1750年)。该数据集包含4,240幅艺术作品,每幅作品都附有详细的元数据和结构化描述,涵盖多个方面如主题、动作、场景、情绪、风格等。数据集适用于图像到文本、文本到图像和图像分类等任务,特别适合学习巴洛克艺术的视觉语言,如明暗对比(chiaroscuro)和戏剧性光线效果。所有艺术作品均属于公共领域,结构化描述则采用MIT许可证发布。

--- 许可证: MIT 任务类别: - 图像转文本 - 文本转图像 - 图像分类 语言: - 英语 标签: - 艺术 - 美术 - 绘画 - 公有领域 - 巴洛克 - 艺术流派 - 明暗对比法(chiaroscuro) - 宗教艺术 - 结构化描述 - 图像描述生成 - 扩散模型 - 视觉语言模型(VLM) 数据规模类别: - 1K<n<10K 配置: - 配置名称: default 数据文件: - 拆分: 训练集 路径: data/train-*.parquet --- # OpenBrush 巴洛克绘画数据集 本数据集源自OpenBrush-75K中的巴洛克风格作品(创作于约1600–1750年)——涵盖明暗对比法、宗教绘画与戏剧性光影效果。 > **本数据集是[jaddai/openbrush-75k](https://huggingface.co/datasets/jaddai/openbrush-75k)的精选子集。** 采用与原数据集一致的MIT协议、描述模板与视觉语言模型(VLM,Qwen3-VL-30B-A3B)。创建该子集旨在避免用户下载75313张图片,仅获取所需的4240张作品即可。 ## 数据集选取缘由 本数据集涵盖经典巴洛克视觉语言风格,涉及卡拉瓦乔、伦勃朗、维米尔、委拉斯开兹、鲁本斯等大师的创作风格,适用于训练学习单光源戏剧性光影、深色背景以及富有质感的织物与皮肤纹理的模型。 **原数据集筛选条件:** `style == "Baroque"` ## 统计信息 - **总图像数:** 4240张 - **数据来源:** 经过筛选的OpenBrush-75K v1.1 - **许可证:** MIT协议 - **描述模板:** V2结构化模板(标签/主体/动作/场景/氛围/风格/光影/色彩/构图) ## 描述模板规范 与原数据集保持一致。每条数据包含完整描述字段`caption_full`,以及9个独立子字段: **TAGS:** 逗号分隔的标准化描述标签 **SUBJECT:** 主体对象描述 **ACTION:** 动作、姿态与场景事件 **SETTING:** 环境与背景信息 **MOOD:** 情感基调与氛围 **STYLE:** 艺术手法与风格解析 **LIGHTING:** 光线方向、质量与色温 **COLOR:** 色彩搭配与色彩关系 **COMPOSITION:** 构图、平衡与视觉焦点 ## 数据字段规范 | 字段名 | 数据类型 | 字段说明 | |-------|------|-------------| | `id` | 字符串 | 唯一标识符 | | `image` | 图像 | 艺术作品(PNG字节流) | | `width` | 整数 | 图像宽度(像素) | | `height` | 整数 | 图像高度(像素) | | `artist` | 字符串 | 艺术家姓名 | | `style` | 字符串 | 艺术流派/风格 | | `genre` | 字符串 | 作品体裁 | | `tags` | 字符串列表 | 标准化描述标签 | | `subject`, `action`, `setting`, `mood`, `style_description`, `lighting`, `color`, `composition` | 字符串 | 各维度描述子字段 | | `caption_full` | 字符串 | 完整结构化描述 | | `source_file` | 字符串 | 原始文件名 | ## 数据集加载方式 以下为Python加载示例代码: python from datasets import load_dataset dataset = load_dataset("jaddai/openbrush-baroque") print(len(dataset["train"])) # 输出:4240 example = dataset["train"][0] print(example["caption_full"]) ## 与原数据集的关系 本数据集是[jaddai/openbrush-75k](https://huggingface.co/datasets/jaddai/openbrush-75k) v1.1的筛选子集,所有图像、描述与元数据均与原数据集完全一致,未进行重新标注或修改。 若需获取完整的OpenBrush数据集(共75313幅绘画作品),请使用原数据集;若仅需本子集,则可通过本数据集节省带宽与磁盘空间。 ### 同系列子集 - [openbrush-van-gogh](https://huggingface.co/datasets/jaddai/openbrush-van-gogh) - [openbrush-monet](https://huggingface.co/datasets/jaddai/openbrush-monet) - [openbrush-renoir](https://huggingface.co/datasets/jaddai/openbrush-renoir) - [openbrush-rembrandt](https://huggingface.co/datasets/jaddai/openbrush-rembrandt) - [openbrush-impressionism](https://huggingface.co/datasets/jaddai/openbrush-impressionism) - [openbrush-renaissance](https://huggingface.co/datasets/jaddai/openbrush-renaissance) - [openbrush-ukiyo-e](https://huggingface.co/datasets/jaddai/openbrush-ukiyo-e) - [openbrush-baroque](https://huggingface.co/datasets/jaddai/openbrush-baroque) - [openbrush-landscapes](https://huggingface.co/datasets/jaddai/openbrush-landscapes) - [openbrush-portraits](https://huggingface.co/datasets/jaddai/openbrush-portraits) - [openbrush-religious-art](https://huggingface.co/datasets/jaddai/openbrush-religious-art) - [openbrush-anonymous-masters](https://huggingface.co/datasets/jaddai/openbrush-anonymous-masters) - [openbrush-impressionist-landscapes](https://huggingface.co/datasets/jaddai/openbrush-impressionist-landscapes) ## 许可证 采用MIT协议。数据集内的艺术作品均属于公有领域(所有艺术家均于1954年前逝世),结构化描述为原创内容,同样以MIT协议发布。 ## 引用格式 bibtex @dataset{openbrush_openbrush_baroque, title={OpenBrush Baroque}, author={jaddai}, year={2026}, publisher={Hugging Face}, url={https://huggingface.co/datasets/jaddai/openbrush-baroque}, note={Curated subset of openbrush-75k} } ## 致谢 - 本数据集的原始艺术作品图像源自公有领域艺术馆藏 - 描述内容由Qwen3-VL-30B-A3B生成 - 标签标准化工作基于大语言模型(LLM)的语义映射完成
提供机构:
jaddai
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作