openbrush-portraits
收藏OpenBrush Portraits 数据集详情
数据集概述
OpenBrush Portraits 是从 jaddai/openbrush-75k 数据集中筛选出的肖像画子集,包含跨越所有艺术家、艺术运动和世纪的历史肖像画作。该子集专为需要多样化历史绘画风格肖像训练数据的用户设计。
核心统计
- 图片总数: 13,059 张
- 数据来源: OpenBrush-75K v1.1(筛选子集)
- 许可证: MIT
- 标注模式: v2 结构化标注
筛选条件
从父数据集中按 genre == "portrait" 筛选得到。覆盖广泛历史时期,包括文艺复兴半身肖像、巴洛克明暗对比、洛可可社交、浪漫主义、现实主义、印象派、后印象派、表现主义等。
数据模式 (Schema)
| 字段 | 类型 | 描述 |
|---|---|---|
id |
string | 唯一标识符 |
image |
Image | 艺术品图像(PNG 格式) |
width |
int | 图像宽度(像素) |
height |
int | 图像高度(像素) |
artist |
string | 艺术家姓名 |
style |
string | 艺术运动/风格 |
genre |
string | 体裁 |
tags |
list[string] | 标准化描述标签 |
subject |
string | 主体描述 |
action |
string | 动作、姿态 |
setting |
string | 环境和背景 |
mood |
string | 情感基调和氛围 |
style_description |
string | 艺术技巧和风格分析 |
lighting |
string | 光线方向、质量、色温 |
color |
string | 调色板和色彩关系 |
composition |
string | 构图、平衡、焦点 |
caption_full |
string | 完整结构化标注 |
source_file |
string | 原始文件名 |
标注结构
每条数据包含 caption_full 及 9 个独立字段:
- TAGS: 逗号分隔的标准化描述标签
- SUBJECT: 主要主体描述
- ACTION: 运动、姿态、发生的事件
- SETTING: 环境和背景
- MOOD: 情感基调和氛围
- STYLE: 艺术技巧和风格分析
- LIGHTING: 光线方向、质量、色温
- COLOR: 调色板和色彩关系
- COMPOSITION: 构图、平衡、焦点
与父数据集的关系
本数据集是 jaddai/openbrush-75k v1.1 的一个筛选切片。所有图像、标注和元数据与父数据集中完全一致,未进行任何重新标注或修改。若需要完整的 75,313 幅画作,请使用父数据集。
使用示例
python from datasets import load_dataset
dataset = load_dataset("jaddai/openbrush-portraits") print(len(dataset["train"])) # 13,059
example = dataset["train"][0] print(example["caption_full"])
引用信息
bibtex @dataset{openbrush_openbrush_portraits, title={OpenBrush Portraits}, author={jaddai}, year={2026}, publisher={Hugging Face}, url={https://huggingface.co/datasets/jaddai/openbrush-portraits}, note={Curated subset of openbrush-75k} }




