smk_canon_paintings
收藏Hugging Face2025-10-23 更新2025-10-24 收录
下载链接:
https://huggingface.co/datasets/chcaa/smk_canon_paintings
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个包含艺术作品详细信息的集合,涵盖了作品的多种属性,如作品的唯一标识符、时间段、起始年份、标题、艺术家列表、作品类型、地理位置、展览历史、获取日期等。数据集还包含了丰富的角色信息、技术信息、展览细节以及文献资料等。
This dataset is a comprehensive collection of detailed information on artworks, covering various attributes of the works, including unique identifiers, time periods, start years, titles, artist lists, artwork types, geographical locations, exhibition histories, acquisition dates, among others. Additionally, the dataset includes rich character-related information, technical details, exhibition specifics, and documentary materials.
提供机构:
Center for Humanities Computing Aarhus
创建时间:
2025-10-23
原始信息汇总
SMK Canon Paintings 数据集概述
数据集基本信息
- 数据集名称:SMK Canon Paintings
- 数据量:34,532,901字节
- 下载大小:22,837,044字节
- 样本数量:1,656条记录
- 数据分割:仅包含训练集(train)
数据特征结构
核心标识信息
- smk_id:作品标识符
- title:作品标题
- smk_exhibitions:SMK展览信息
时间信息
- period:时期
- start_year:起始年份
- acquisition_date:获取日期
- prod_year:生产年份
- prod_diff:生产差异
艺术家信息
- first_artist:首位艺术家
- all_artists:所有艺术家列表
- num_artists:艺术家数量
- gender:性别列表
- birth_death:生卒年份列表
- nationality:国籍列表
- artist_roles:艺术家角色列表
作品属性
- main_type:主要类型
- all_types:所有类型列表
- techniques:技法列表
- colors:颜色列表
- rgb:RGB值
- entropy:熵值
- has_text:是否包含文本
图像信息
- image_thumbnail:缩略图
- embedding:嵌入向量
- grey_embedding:灰度嵌入向量
展览与历史
- exhibitions:展览记录(包含日期、展览名称、场馆)
- exhibition_venues:展览场馆列表
- ex_years:展览年份列表
- history:历史记录
- object_history_note:物品历史注释
文献与文档
- documentation:文献资料(包含作者、注释、书架标记、标题、出版年份)
- literary_reference:文学参考文献
- prod_notes:生产注释
其他信息
- content_person:内容人物
- geo_location:地理位置
- tags_en:英文标签
- responsible_department:负责部门
- current_location_name:当前位置名称
- on_display:是否在展示中
- enrichment_url:丰富化URL
- creator_roles:创作者角色列表
- num_creators:创作者数量
- total_canons:总经典作品
- exb_canon:展览经典作品
搜集汇总
数据集介绍

构建方式
在文化遗产数字化研究领域,smk_canon_paintings数据集通过系统整合丹麦国家美术馆的典藏资源构建而成。其核心数据来源于馆藏绘画作品的元数据档案,采用结构化提取技术将艺术品的创作年代、艺术家生平、技法特征等维度信息转化为标准化字段。数据构建过程特别注重历史文献与数字特征的融合,通过嵌入向量技术对画作视觉元素进行数学建模,并关联展览记录、文献引用等跨时空文化脉络,形成多维度的艺术研究矩阵。
特点
该数据集呈现出艺术研究与计算机科学交叉的典型特征,其字段设计兼具文化语义与计算可操作性。除包含画作标题、创作年代等基础属性外,更通过色彩序列、熵值分析量化视觉美学特征,而嵌入向量字段则为风格迁移等计算任务提供支撑。独特的链式数据结构能同时记录多位艺术家的协作关系,配合展览历史与文献参考形成的时空轨迹,构建出动态演进的艺术生态图谱。
使用方法
研究者可借助该数据集展开多模态艺术分析,通过图像缩略图与嵌入向量的对应关系进行视觉风格聚类。时序字段与地理位置的组合支持艺术流派传播路径的可视化重构,而技法材料与色彩分布的关联分析则能揭示特定时期的创作规律。在具体应用中,可将生产年份与展览记录作为时间锚点,结合艺术家国籍序列构建文化影响力模型,或利用标签系统训练绘画主题自动分类器。
背景与挑战
背景概述
艺术数字化研究领域在文化遗产保护与智能分析需求推动下蓬勃发展,smk_canon_paintings数据集由丹麦国家美术馆(Statens Museum for Kunst)主导构建,聚焦西方绘画艺术的系统性数字化典藏。该数据集通过多维特征标注体系,整合了画作创作年代、艺术家谱系、技法材料及展览历史等关键元数据,为艺术史量化研究与跨模态分析提供了结构化基础。其核心价值在于建立可计算的艺术典藏标准,推动绘画风格演变、艺术家影响力传播等传统人文课题向数据驱动范式转型。
当前挑战
艺术数据标准化面临实体关联复杂性挑战,需解决跨世纪作品在创作年代判定、艺术家身份消歧等维度的一致性问题。构建过程中需克服非结构化史料转化难题,包括手写档案的时序校准、多语言艺术术语的语义映射,以及破损画作色彩特征的数字化复原。技术层面需平衡视觉特征嵌入与人文语境保留之间的张力,确保算法模型能有效捕捉绘画材质、构图规律等专业属性,同时维持艺术阐释的开放性特质。
常用场景
经典使用场景
在文化遗产数字化研究领域,smk_canon_paintings数据集为艺术史分析提供了结构化支撑。其多维特征如创作年代、艺术家信息与色彩构成,常被用于构建绘画风格的时序演化模型,通过计算嵌入向量实现跨时期作品的自动分类与关联分析。
解决学术问题
该数据集通过系统化标注解决了艺术史研究中样本分散的难题。学者可基于作品年代、技法等字段量化分析艺术流派演变规律,其丰富的元数据为验证艺术社会史理论提供了实证基础,显著提升了风格传播研究的可重复性。
衍生相关工作
围绕该数据集衍生的经典研究包括基于嵌入向量的跨模态检索系统,将视觉特征与文献记录进行关联建模。另有学者利用其层次化元数据构建艺术影响力网络图谱,揭示了不同时期创作者间的风格传承路径。
以上内容由遇见数据集搜集并总结生成



