openbrush-religious-art
收藏Hugging Face2026-05-09 更新2026-05-10 收录
下载链接:
https://huggingface.co/datasets/jaddai/openbrush-religious-art
下载链接
链接失效反馈官方服务:
资源简介:
OpenBrush Religious Art是一个专注于宗教艺术绘画的数据集,包含从中世纪到早期现代时期的宗教叙事绘画,尤其侧重于文艺复兴和巴洛克时期的作品。该数据集是OpenBrush-75K数据集的精选子集,包含6,119张图像,每张图像都配有结构化标注和元数据。标注内容包括主题、动作、场景、情绪、风格、光照、色彩和构图等多个方面。数据集适用于图像到文本、文本到图像和图像分类等任务。所有图像均为公共领域作品,标注内容采用MIT许可证发布。数据集加载方便,可直接通过Hugging Face的`datasets`库使用。
创建时间:
2026-04-28
原始信息汇总
OpenBrush Religious Art 数据集概述
数据集简介
OpenBrush Religious Art 是从 OpenBrush-75K 数据集中筛选出的宗教绘画子集,专注于中世纪至近现代的宗教叙事绘画,涵盖文艺复兴和巴洛克时期为主的作品。
数据集规模
- 总图像数量: 6,119 张
- 数据来源: OpenBrush-75K v1.1(筛选后)
- 许可协议: MIT
任务类型
- 图像到文本(image-to-text)
- 文本到图像(text-to-image)
- 图像分类(image-classification)
数据内容特点
- 主题范围: 圣母与圣婴、受难场景、圣徒像、圣经叙事、天使报喜、旧约场景等
- 艺术时期: 以文艺复兴和巴洛克时期为主
- 筛选条件:
genre == "religious painting"
数据模式(Schema)
| 字段 | 类型 | 描述 |
|---|---|---|
id |
string | 唯一标识符 |
image |
Image | 艺术作品(PNG 格式) |
width |
int | 图像宽度(像素) |
height |
int | 图像高度(像素) |
artist |
string | 艺术家名称 |
style |
string | 艺术运动/风格 |
genre |
string | 流派 |
tags |
list[string] | 标准化描述标签 |
subject |
string | 主体描述 |
action |
string | 动作与姿势 |
setting |
string | 环境与背景 |
mood |
string | 情绪与氛围 |
style_description |
string | 艺术技法与风格分析 |
lighting |
string | 光线方向、质量与色温 |
color |
string | 调色板与色彩关系 |
composition |
string | 构图、平衡与视觉焦点 |
caption_full |
string | 完整结构化描述 |
source_file |
string | 原始文件名 |
描述结构(Caption Schema)
每条数据包含 caption_full 字段及 9 个独立描述字段,采用结构化格式:
- TAGS: 逗号分隔的标准化描述标签
- SUBJECT: 主体描述
- ACTION: 动作与姿势
- SETTING: 环境与背景
- MOOD: 情绪与氛围
- STYLE: 艺术技法与风格分析
- LIGHTING: 光线方向、质量与色温
- COLOR: 调色板与色彩关系
- COMPOSITION: 构图、平衡与视觉焦点
数据加载示例
python from datasets import load_dataset
dataset = load_dataset("jaddai/openbrush-religious-art") print(len(dataset["train"])) # 6,119
example = dataset["train"][0] print(example["caption_full"])
与父数据集的关系
- 本数据集是 jaddai/openbrush-75k v1.1 的过滤子集
- 所有图像、描述和元数据与父数据集一致,未进行重新标注或修改
- 如需完整的 75,313 幅绘画数据,请使用父数据集
许可信息
- 数据集协议:MIT
- 底层艺术作品:公有领域(所有艺术家于 1954 年前去世)
- 结构化描述:原创作品,采用 MIT 许可
引用格式
bibtex @dataset{openbrush_openbrush_religious_art, title={OpenBrush Religious Art}, author={jaddai}, year={2026}, publisher={Hugging Face}, url={https://huggingface.co/datasets/jaddai/openbrush-religious-art}, note={Curated subset of openbrush-75k} }
搜集汇总
数据集介绍

构建方式
OpenBrush Religious Art数据集源自开源项目OpenBrush-75K v1.1,通过筛选genre字段为"religious painting"的样本构建而成,共包含6,119幅图像。这些图像涵盖从中世纪到近现代的宗教叙事绘画,尤以文艺复兴与巴洛克时期作品为大宗,主题涉及圣母圣子、基督受难、圣徒、天使报喜及旧约场景等。所有图像、标注与元数据均继承自父数据集,未做任何重新标注或修改,确保了数据的一致性与可追溯性。
特点
该数据集聚焦于宗教绘画这一鲜明的视觉体裁,具有高度的主题统一性与艺术史价值。每幅图像均附有V2结构化标题,包含TAGS、SUBJECT、ACTION、SETTING、MOOD、STYLE、LIGHTING、COLOR、COMPOSITION九个独立字段,以及完整的caption_full描述。图像均为公共领域作品,采用MIT许可证发布,适合学术研究、模型训练与创作实践。
使用方法
用户可通过HuggingFace Datasets库便捷加载该数据集:使用load_dataset("jaddai/openbrush-religious-art")即可获取训练集,包含6,119条样本。每条数据提供图像、艺术家、风格、体裁、结构化标题等丰富字段,适用于图像描述生成、文本到图像生成、视觉语言模型训练及图像分类等下游任务。数据集结构清晰,可直接用于深度学习项目的流水线。
背景与挑战
背景概述
OpenBrush Religious Art数据集由研究者jaddai于2026年创建,源自OpenBrush-75K v1.1,专注于宗教绘画这一视觉体裁,涵盖从中世纪至近代早期的圣徒、圣经场景及虔诚作品,尤其以文艺复兴与巴洛克时期的杰作为重。该数据集通过精细筛选得到6,119幅高分辨率图像,并采用Qwen3-VL-30B-A3B模型生成结构化标题,涵盖标签、主题、动作、场景、情感、风格、光线、色彩与构图等九个维度。作为公共领域艺术品与计算机视觉交叉领域的代表性资源,它推动了宗教艺术图像理解、多模态模型训练及文化计算研究的发展,为美术分析与生成任务提供了高质量的基准数据。
当前挑战
该数据集面临的核心挑战包括:在领域问题层面,如何从海量绘画中自动识别并区分宗教叙事与其他体裁,以及如何确保模型准确理解复杂的神学符号与历史语境,避免文化偏见;在构建过程中,需要从75,313幅图像中精确筛选出6,119幅符合宗教绘画定义的作品,这依赖于可靠的元数据标注与体裁分类标准,同时要避免因数据集规模缩减而丢失多样性或引入选择性偏差。此外,如何处理不同年代、地域与流派在视觉风格上的巨大差异,以及确保结构化标题的完整性与一致性,均为构建高质量细粒度数据集的技术难点。
常用场景
经典使用场景
在计算机视觉与多模态学习领域,OpenBrush Religious Art数据集被广泛用于宗教绘画的图像描述生成与风格解析任务。该数据集收录了从中世纪至早期现代、以文艺复兴和巴洛克时期为主的6,119幅宗教叙事画作,涵盖圣母圣婴、受难场景、圣徒肖像及旧约故事等经典主题。其结构化的标注体系——包括TAGS、SUBJECT、ACTION、SETTING等九个精细化字段——为训练视觉语言模型(VLM)和扩散模型提供了高质量、多粒度的图文对。研究者常利用这一数据集来提升模型在宗教艺术这一视觉风格高度统一且语义复杂的子领域中的图像理解与文本生成能力,尤其适合评估模型对历史绘画语境、符号隐喻及情感氛围的捕捉水平。
解决学术问题
该数据集有效填补了艺术史计算分析中宗教题材细粒度研究的空白。过往的公开艺术数据集多侧重整体绘画分类或通用图像描述,缺乏对宗教绘画这一特定视觉体裁的深耕。OpenBrush Religious Art通过提供结构化的多维度标注(如LIGHTING、COLOR、COMPOSITION等),解决了传统数据集在构图、光影与情感氛围等抽象特征上缺乏可量化描述的问题,从而支持更深入的跨模态语义对齐与风格迁移研究。其意义在于,为学术社区提供了一个标准化、可复现的基准,推动了对宗教视觉叙事的自动化解析,助力从计算机科学视角重新审视艺术史中的象征体系与审美演变。
衍生相关工作
基于OpenBrush Religious Art,学界已衍生出多项具有影响力的研究工作。其中,对OpenBrush-75K父数据集的整体标注工作为后续多子集划分奠定了方法论基础,而该宗教艺术子集本身频繁被用作测试不同视觉语言模型在特定文化语境下表现力的基准。相关衍生工作包括:探讨视觉语言模型对文艺复兴绘画中宗教符号识别准确率的评估基准,以及利用扩散模型进行宗教题材画作风格迁移与年代推断的研究。此外,部分研究者将该子集与其他艺术家或流派子集(如openbrush-renaissance、openbrush-baroque)结合,开展跨风格对比学习,以揭示宗教议题在不同艺术运动中的视觉表达差异。
以上内容由遇见数据集搜集并总结生成



