EUFCC-340K
收藏arXiv2024-06-04 更新2024-06-21 收录
下载链接:
https://github.com/cesc47/EUFCC-340K
下载链接
链接失效反馈官方服务:
资源简介:
EUFCC-340K数据集是由欧洲文化门户网站Europeana收集的,旨在为GLAM(画廊、图书馆、档案馆和博物馆)领域的自动元数据注释提供支持。该数据集包含超过340,000张图像,涵盖多种文化资产,如艺术品、雕塑、钱币学文物等。数据集的创建过程中,利用了Getty的“艺术与建筑词典”(AAT)进行结构化注释,确保了数据的高质量和专业性。EUFCC-340K数据集的应用领域主要集中在改善文化遗产领域的多标签分类工具,以减轻目录编制任务的负担。
EUFCC-340K is a dataset collected by Europeana, the European cultural portal, intended to support automatic metadata annotation for the GLAM (Galleries, Libraries, Archives, and Museums) domain. This dataset comprises over 340,000 images spanning diverse cultural assets including artworks, sculptures, numismatic artifacts, and more. During its curation, Getty's Art & Architecture Thesaurus (AAT) was utilized for structured annotation, which guarantees the high quality and professional rigor of the dataset. The primary applications of EUFCC-340K focus on advancing multi-label classification tools in the cultural heritage field, thereby reducing the workload associated with cataloging tasks.
提供机构:
计算机视觉中心,巴塞罗那自治大学,巴塞罗那,08290,加泰罗尼亚,西班牙。Nubilum,格兰维亚大道575号,1楼1室,巴塞罗那,08011,加泰罗尼亚,西班牙。媒体集成与通信中心,佛罗伦萨大学,佛罗伦萨,50134,意大利。
创建时间:
2024-06-04
搜集汇总
背景与挑战
背景概述
EUFCC-340K是一个大型文化遗产图像数据集,包含346,324张来自欧洲多机构的标注图像,采用Getty AAT的层次结构进行多标签标注,适用于开放研究和应用。数据集具有多标签和层次结构的特点,涵盖了材料、对象类型、学科和主题四个方面的标签。
以上内容由遇见数据集搜集并总结生成



