five

openbrush-renoir

收藏
Hugging Face2026-05-08 更新2026-05-09 收录
下载链接:
https://huggingface.co/datasets/jaddai/openbrush-renoir
下载链接
链接失效反馈
官方服务:
资源简介:
OpenBrush Renoir 是一个精选的子数据集,源自 OpenBrush-75K,专注于印象派画家 Pierre-Auguste Renoir 的艺术作品。该数据集包含 1,400 幅画作,每幅作品都配有结构化的视觉语言模型(Qwen3-VL-30B-A3B)生成的详细描述。描述内容包括多个方面:主题、动作、场景、情绪、风格、光线、色彩和构图。数据集适用于图像到文本、文本到图像和图像分类等任务。所有画作均来自公共领域,结构化描述则以 MIT 许可证发布。数据集还提供了每幅作品的元数据,如艺术家、风格、流派和标准化描述标签。
创建时间:
2026-04-27
原始信息汇总

数据集概述:OpenBrush Renoir

OpenBrush Renoir 是从 jaddai/openbrush-75k 数据集中筛选出的子集,专门聚焦于法国印象派画家 皮埃尔-奥古斯特·雷诺阿 的全部作品。

核心信息

  • 总图像数: 1,400 张
  • 许可证: MIT(底层艺术品为公共领域,结构化标题为MIT许可)
  • 语言: 英语
  • 任务类别: 图像到文本、文本到图像、图像分类
  • 来源: OpenBrush-75K v1.1,筛选条件为 artist == "Pierre Auguste Renoir"
  • 标题生成模型: Qwen3-VL-30B-A3B

数据集特点

  • 与父数据集相比,无需下载全部 75,313 张图像即可获取所需的 1,400 张雷诺阿作品,节省带宽和磁盘空间。
  • 标题结构中包含对雷诺阿风格(人物与肖像印象派)的专门描述,例如肤色、织物处理和软边融合。

数据集结构

  • 配置名: default
  • 数据文件: Parquet 格式 (data/train-*.parquet)
  • 数据集大小: 1K < n < 10K

数据模式 (Schema)

每条记录包含以下字段:

字段 类型 描述
id string 唯一标识符
image Image 艺术品图像 (PNG)
width int 图像宽度 (像素)
height int 图像高度 (像素)
artist string 艺术家姓名
style string 艺术运动/风格
genre string 流派
tags list[string] 标准化描述标签
subject string 主要主题描述
action string 动作与手势
setting string 环境与背景
mood string 情绪基调与氛围
style_description string 艺术技巧与风格分析
lighting string 灯光方向、质量与温度
color string 调色板与色彩关系
composition string 构图、平衡与焦点
caption_full string 完整结构化标题
source_file string 原始文件名

标题模板

每条记录包含 9 个独立的描述字段,遵循统一结构:

TAGS: 逗号分隔的标准化描述标签 SUBJECT: 主要主题描述 ACTION: 动作与手势 SETTING: 环境与背景 MOOD: 情绪基调与氛围 STYLE: 艺术技巧与风格分析 LIGHTING: 灯光方向、质量与温度 COLOR: 调色板与色彩关系 COMPOSITION: 构图、平衡与焦点

数据加载示例

python from datasets import load_dataset

dataset = load_dataset("jaddai/openbrush-renoir") print(len(dataset["train"])) # 输出: 1400

example = dataset["train"][0] print(example["caption_full"])

与父数据集的关系

  • 此子集是 jaddai/openbrush-75k v1.1 的过滤切片。
  • 所有图像、标题和元数据与父数据集完全一致,未进行重新标注或修改。

相关子集

该数据集是 OpenBrush 系列的一部分,其他子集包括:

引用信息

bibtex @dataset{openbrush_openbrush_renoir, title={OpenBrush Renoir}, author={jaddai}, year={2026}, publisher={Hugging Face}, url={https://huggingface.co/datasets/jaddai/openbrush-renoir}, note={Curated subset of openbrush-75k} }

致谢

  • 原始艺术品图像来源于公共领域艺术收藏。
  • 标题使用 Qwen3-VL-30B-A3B 生成。
  • 标签标准化借助基于 LLM 的语义映射完成。
搜集汇总
数据集介绍
main_image_url
构建方式
OpenBrush-Renoir数据集是自大规模艺术画作语料库OpenBrush-75K中精心筛选的子集,专注于收录法国印象派大师皮埃尔-奥古斯特·雷诺阿的全部作品。通过执行艺术家字段过滤(artist == "Pierre Auguste Renoir"),从总量达75,313幅画作的父数据集中精准提取出1,400幅与雷诺阿相关的图像。所有图像、元数据及对应标题均直接沿用父数据集,未经过二次处理或重新标注,确保了数据的一致性与纯净性。标题由Qwen3-VL-30B-A3B视觉语言模型生成,采用结构化标注框架,涵盖标签、主体、动作、环境、情绪、风格、光照、色彩及构图九个维度,并保留完整的全文描述字段。
使用方法
用户可通过HuggingFace Datasets库便捷加载该数据集,执行`load_dataset("jaddai/openbrush-renoir")`即可获取包含1,400条样本的训练集。每条记录包含图像字节数据、艺术家名、风格流派、九类结构化标题字段及全文描述,适用于多模态学习任务。在图像描述生成中,可利用`caption_full`字段作为训练目标,或使用独立字段构建细粒度分析模型;在图像分类与风格迁移场景中,可直接将图像与`style_description`或`genre`字段配对;文本到图像生成任务则可利用结构化解构作为条件输入。研究者亦可将其作为OpenBrush-75K的轻量化样本,用于快速原型验证或印象派人物画专项分析。
背景与挑战
背景概述
在计算艺术史与多模态学习的交叉领域中,面向特定艺术流派的精细数据集构建成为推动视觉-语言模型理解美术风格的关键。openbrush-renoir数据集由研究者jaddai于2026年创建,从包含75,313幅画作的OpenBrush-75K语料库中精心筛选出1,400幅皮埃尔-奥古斯特·雷诺阿的作品,专注于印象派人物与肖像画的视觉语义分析。该数据集的核心价值在于,它摒弃了以往跨艺术家、跨流派的笼统标注方式,通过统一的结构化描述范式(TAGS / SUBJECT / ACTION / SETTING / MOOD / STYLE / LIGHTING / COLOR / COMPOSITION),并借助Qwen3-VL-30B-A3B视觉语言模型生成细粒度标注,为研究雷诺阿标志性的柔和笔触、肤色处理与织物质感提供了标准化资源。作为OpenBrush系列的子集,该数据集的发布推动了艺术图像理解领域从宏观分类到微观风格解析的范式转变,对印象派绘画的自动化分析与生成式AI在艺术创作中的应用具有重要意义。
当前挑战
openbrush-renoir数据集所解决的领域问题首先是艺术图像生成与描述中的风格一致性挑战:雷诺阿的印象派技法强调光线在人物肌肤上的柔和过渡与笔触的融合感,传统图像标注难以精确捕捉这种微妙视觉特征,而结构化描述框架需同时兼顾色彩关系、光影方向与情绪氛围的多维度表达。构建过程中,研究者面临显著的数据稀疏性与标注可信度矛盾——从7.5万幅画作中仅筛选出1,400幅雷诺阿作品,过滤后的小样本量虽提升了领域专注性,却可能限制模型对人物姿势、服饰纹理等多样性特征的泛化学习。此外,自动生成的VLM标注虽标准化了格式,但针对雷诺阿特有的“软边缘混合”(soft-edged blending)风格,语言描述与视觉细节之间的语义鸿沟仍需人工校验,避免在扩散模型或图像字幕任务中产生风格失真。
常用场景
经典使用场景
OpenBrush-Renoir数据集凝聚了皮埃尔-奥古斯特·雷诺阿笔下1400幅印象派杰作,每幅作品均附有通过先进视觉语言模型Qwen3-VL-30B-A3B生成的精细化结构描述文本。该数据集最为经典的使用情境在于构建与评估面向艺术领域的图文跨模态理解系统,研究者能够利用其丰富的标签字段(如主体、动作、氛围、风格与光影解析)训练图像描述生成模型,或者作为少样本提示学习的语料库,亦可服务于艺术风格迁移与生成式扩散模型的条件控制任务,为捕捉雷诺阿特有的柔和笔触与肤色渲染提供了精确且标准化的数据支撑。
解决学术问题
在学术研究层面,OpenBrush-Renoir有效回应了艺术计算领域中因数据集过于庞大或风格混杂而难以聚焦单一艺术家特性的关键瓶颈。该数据集解决了如何从海量公共领域画作中高效提取并标记特定印象派大师风格元素的难题,其结构化注释方案为定量分析雷诺阿作品的色彩分布、构图规律与情感表达提供了可操作的基准。这一精细化资源推动了针对个体艺术家感知模型的研究演进,促使学术界能够在消除数据冗余的前提下,深入探讨视觉语言模型在艺术史风格界定、绘画本体特征表征以及细粒度艺术分类等课题中的适用性与局限性。
实际应用
在实际应用层面,OpenBrush-Renoir为数字博物馆、艺术教育平台与创意设计工具赋能了智能化的交互体验。通过利用该数据集训练的模型,博物馆导览应用可自动生成针对每幅雷诺阿画作的灵动解说词,帮助观众理解其表面观察与美学内涵之间的微妙关联。此外,艺术风格滤镜与辅助绘画软件能够借助该数据集的标签体系实现印象派技法的精准模仿,支持用户从雷诺阿的用色方案与虚实处理中汲取灵感,从而降低专业艺术创作的技术门槛,提升创意表达的文化深度。
数据集最近研究
最新研究方向
在生成式人工智能与数字人文深度交融的前沿图景中,openbrush-renoir数据集聚焦于皮埃尔-奥古斯特·雷诺阿(Pierre-Auguste Renoir)的1400幅经典画作,为艺术风格迁移、可控图像生成及视觉语言模型(VLM)的精调提供了高度结构化的多模态语料。该数据集随附的九维度结构化标注体系——涵盖肤色处理、衣物肌理与印象派软边融合笔触——使其成为解析人物与肖像印象派独特色彩学与空间营造的稀缺训练资源。当前研究热点正从通用艺术数据集向艺术家专属语料库演进,openbrush-renoir精准响应了这一细分趋势,支持科研者在小样本条件下复现雷诺阿柔焦般的画面氛围,推动风格保持、笔触模拟与历史画作数字修复等方向在定量评价上的突破。其与主流扩散模型及VLM的无缝接入,更将促进艺术智能创作中艺术家模仿精度与视觉符号解耦能力的跃升。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作