jaddai/openbrush-baroque
收藏Hugging Face2026-04-27 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/jaddai/openbrush-baroque
下载链接
链接失效反馈官方服务:
资源简介:
OpenBrush Baroque数据集是OpenBrush-75K数据集的一个精选子集,专门聚焦于巴洛克艺术(约1600-1750年)。该数据集包含4,240幅艺术作品,每幅作品都附有详细的元数据和结构化描述,涵盖多个方面如主题、动作、场景、情绪、风格等。数据集适用于图像到文本、文本到图像和图像分类等任务,特别适合学习巴洛克艺术的视觉语言,如明暗对比(chiaroscuro)和戏剧性光线效果。所有艺术作品均属于公共领域,结构化描述则采用MIT许可证发布。
---
许可证: MIT
任务类别:
- 图像转文本
- 文本转图像
- 图像分类
语言:
- 英语
标签:
- 艺术
- 美术
- 绘画
- 公有领域
- 巴洛克
- 艺术流派
- 明暗对比法(chiaroscuro)
- 宗教艺术
- 结构化描述
- 图像描述生成
- 扩散模型
- 视觉语言模型(VLM)
数据规模类别:
- 1K<n<10K
配置:
- 配置名称: default
数据文件:
- 拆分: 训练集
路径: data/train-*.parquet
---
# OpenBrush 巴洛克绘画数据集
本数据集源自OpenBrush-75K中的巴洛克风格作品(创作于约1600–1750年)——涵盖明暗对比法、宗教绘画与戏剧性光影效果。
> **本数据集是[jaddai/openbrush-75k](https://huggingface.co/datasets/jaddai/openbrush-75k)的精选子集。** 采用与原数据集一致的MIT协议、描述模板与视觉语言模型(VLM,Qwen3-VL-30B-A3B)。创建该子集旨在避免用户下载75313张图片,仅获取所需的4240张作品即可。
## 数据集选取缘由
本数据集涵盖经典巴洛克视觉语言风格,涉及卡拉瓦乔、伦勃朗、维米尔、委拉斯开兹、鲁本斯等大师的创作风格,适用于训练学习单光源戏剧性光影、深色背景以及富有质感的织物与皮肤纹理的模型。
**原数据集筛选条件:** `style == "Baroque"`
## 统计信息
- **总图像数:** 4240张
- **数据来源:** 经过筛选的OpenBrush-75K v1.1
- **许可证:** MIT协议
- **描述模板:** V2结构化模板(标签/主体/动作/场景/氛围/风格/光影/色彩/构图)
## 描述模板规范
与原数据集保持一致。每条数据包含完整描述字段`caption_full`,以及9个独立子字段:
**TAGS:** 逗号分隔的标准化描述标签
**SUBJECT:** 主体对象描述
**ACTION:** 动作、姿态与场景事件
**SETTING:** 环境与背景信息
**MOOD:** 情感基调与氛围
**STYLE:** 艺术手法与风格解析
**LIGHTING:** 光线方向、质量与色温
**COLOR:** 色彩搭配与色彩关系
**COMPOSITION:** 构图、平衡与视觉焦点
## 数据字段规范
| 字段名 | 数据类型 | 字段说明 |
|-------|------|-------------|
| `id` | 字符串 | 唯一标识符 |
| `image` | 图像 | 艺术作品(PNG字节流) |
| `width` | 整数 | 图像宽度(像素) |
| `height` | 整数 | 图像高度(像素) |
| `artist` | 字符串 | 艺术家姓名 |
| `style` | 字符串 | 艺术流派/风格 |
| `genre` | 字符串 | 作品体裁 |
| `tags` | 字符串列表 | 标准化描述标签 |
| `subject`, `action`, `setting`, `mood`, `style_description`, `lighting`, `color`, `composition` | 字符串 | 各维度描述子字段 |
| `caption_full` | 字符串 | 完整结构化描述 |
| `source_file` | 字符串 | 原始文件名 |
## 数据集加载方式
以下为Python加载示例代码:
python
from datasets import load_dataset
dataset = load_dataset("jaddai/openbrush-baroque")
print(len(dataset["train"])) # 输出:4240
example = dataset["train"][0]
print(example["caption_full"])
## 与原数据集的关系
本数据集是[jaddai/openbrush-75k](https://huggingface.co/datasets/jaddai/openbrush-75k) v1.1的筛选子集,所有图像、描述与元数据均与原数据集完全一致,未进行重新标注或修改。
若需获取完整的OpenBrush数据集(共75313幅绘画作品),请使用原数据集;若仅需本子集,则可通过本数据集节省带宽与磁盘空间。
### 同系列子集
- [openbrush-van-gogh](https://huggingface.co/datasets/jaddai/openbrush-van-gogh)
- [openbrush-monet](https://huggingface.co/datasets/jaddai/openbrush-monet)
- [openbrush-renoir](https://huggingface.co/datasets/jaddai/openbrush-renoir)
- [openbrush-rembrandt](https://huggingface.co/datasets/jaddai/openbrush-rembrandt)
- [openbrush-impressionism](https://huggingface.co/datasets/jaddai/openbrush-impressionism)
- [openbrush-renaissance](https://huggingface.co/datasets/jaddai/openbrush-renaissance)
- [openbrush-ukiyo-e](https://huggingface.co/datasets/jaddai/openbrush-ukiyo-e)
- [openbrush-baroque](https://huggingface.co/datasets/jaddai/openbrush-baroque)
- [openbrush-landscapes](https://huggingface.co/datasets/jaddai/openbrush-landscapes)
- [openbrush-portraits](https://huggingface.co/datasets/jaddai/openbrush-portraits)
- [openbrush-religious-art](https://huggingface.co/datasets/jaddai/openbrush-religious-art)
- [openbrush-anonymous-masters](https://huggingface.co/datasets/jaddai/openbrush-anonymous-masters)
- [openbrush-impressionist-landscapes](https://huggingface.co/datasets/jaddai/openbrush-impressionist-landscapes)
## 许可证
采用MIT协议。数据集内的艺术作品均属于公有领域(所有艺术家均于1954年前逝世),结构化描述为原创内容,同样以MIT协议发布。
## 引用格式
bibtex
@dataset{openbrush_openbrush_baroque,
title={OpenBrush Baroque},
author={jaddai},
year={2026},
publisher={Hugging Face},
url={https://huggingface.co/datasets/jaddai/openbrush-baroque},
note={Curated subset of openbrush-75k}
}
## 致谢
- 本数据集的原始艺术作品图像源自公有领域艺术馆藏
- 描述内容由Qwen3-VL-30B-A3B生成
- 标签标准化工作基于大语言模型(LLM)的语义映射完成
提供机构:
jaddai



