openbrush-renoir
收藏数据集概述:OpenBrush Renoir
OpenBrush Renoir 是从 jaddai/openbrush-75k 数据集中筛选出的子集,专门聚焦于法国印象派画家 皮埃尔-奥古斯特·雷诺阿 的全部作品。
核心信息
- 总图像数: 1,400 张
- 许可证: MIT(底层艺术品为公共领域,结构化标题为MIT许可)
- 语言: 英语
- 任务类别: 图像到文本、文本到图像、图像分类
- 来源: OpenBrush-75K v1.1,筛选条件为
artist == "Pierre Auguste Renoir" - 标题生成模型: Qwen3-VL-30B-A3B
数据集特点
- 与父数据集相比,无需下载全部 75,313 张图像即可获取所需的 1,400 张雷诺阿作品,节省带宽和磁盘空间。
- 标题结构中包含对雷诺阿风格(人物与肖像印象派)的专门描述,例如肤色、织物处理和软边融合。
数据集结构
- 配置名:
default - 数据文件: Parquet 格式 (
data/train-*.parquet) - 数据集大小: 1K < n < 10K
数据模式 (Schema)
每条记录包含以下字段:
| 字段 | 类型 | 描述 |
|---|---|---|
id |
string | 唯一标识符 |
image |
Image | 艺术品图像 (PNG) |
width |
int | 图像宽度 (像素) |
height |
int | 图像高度 (像素) |
artist |
string | 艺术家姓名 |
style |
string | 艺术运动/风格 |
genre |
string | 流派 |
tags |
list[string] | 标准化描述标签 |
subject |
string | 主要主题描述 |
action |
string | 动作与手势 |
setting |
string | 环境与背景 |
mood |
string | 情绪基调与氛围 |
style_description |
string | 艺术技巧与风格分析 |
lighting |
string | 灯光方向、质量与温度 |
color |
string | 调色板与色彩关系 |
composition |
string | 构图、平衡与焦点 |
caption_full |
string | 完整结构化标题 |
source_file |
string | 原始文件名 |
标题模板
每条记录包含 9 个独立的描述字段,遵循统一结构:
TAGS: 逗号分隔的标准化描述标签 SUBJECT: 主要主题描述 ACTION: 动作与手势 SETTING: 环境与背景 MOOD: 情绪基调与氛围 STYLE: 艺术技巧与风格分析 LIGHTING: 灯光方向、质量与温度 COLOR: 调色板与色彩关系 COMPOSITION: 构图、平衡与焦点
数据加载示例
python from datasets import load_dataset
dataset = load_dataset("jaddai/openbrush-renoir") print(len(dataset["train"])) # 输出: 1400
example = dataset["train"][0] print(example["caption_full"])
与父数据集的关系
- 此子集是 jaddai/openbrush-75k v1.1 的过滤切片。
- 所有图像、标题和元数据与父数据集完全一致,未进行重新标注或修改。
相关子集
该数据集是 OpenBrush 系列的一部分,其他子集包括:
- openbrush-van-gogh
- openbrush-monet
- openbrush-rembrandt
- openbrush-impressionism
- openbrush-renaissance
- openbrush-ukiyo-e
- openbrush-baroque
- openbrush-landscapes
- openbrush-portraits
- openbrush-religious-art
- openbrush-anonymous-masters
- openbrush-impressionist-landscapes
引用信息
bibtex @dataset{openbrush_openbrush_renoir, title={OpenBrush Renoir}, author={jaddai}, year={2026}, publisher={Hugging Face}, url={https://huggingface.co/datasets/jaddai/openbrush-renoir}, note={Curated subset of openbrush-75k} }
致谢
- 原始艺术品图像来源于公共领域艺术收藏。
- 标题使用 Qwen3-VL-30B-A3B 生成。
- 标签标准化借助基于 LLM 的语义映射完成。




