five

ShiftedBronzes|考古学数据集|青铜器分类数据集

收藏
arXiv2024-12-17 更新2024-12-19 收录
考古学
青铜器分类
下载链接:
http://arxiv.org/abs/2412.12683v1
下载链接
链接失效反馈
资源简介:
ShiftedBronzes数据集由吉林大学创建,旨在解决古代中国青铜器年代测定中的细粒度分类问题。该数据集包含6208张青铜器(如鼎和簋)的彩色、素描和拓印图像,以及51,023张通过零样本材料转移模型生成的容器和青铜器图像。数据集的创建过程包括从考古书籍和网站收集数据,并由专家进行详细标注。ShiftedBronzes数据集主要应用于考古学中的青铜器年代测定任务,旨在解决开放世界设置下的分布偏移问题,并为细粒度分类和异常检测方法提供基准测试。
提供机构:
吉林大学
创建时间:
2024-12-17
AI搜集汇总
数据集介绍
main_image_url
构建方式
ShiftedBronzes数据集通过扩展现有的青铜器Ding数据集构建而成,涵盖了两种青铜器数据(Ding和Gui)以及七种常见的分布偏移数据(如素描图像、拓片图像、材质转移生成的图像等)。数据集包括6,208张彩色、素描和拓片图像,以及51,023张材质转移和容器图像。所有数据均经过专家标注,确保了数据的质量和准确性。
特点
ShiftedBronzes数据集的显著特点在于其多样化的分布偏移数据,这些数据模拟了考古学中常见的分布偏移场景。素描和拓片图像与青铜器ID数据的分布偏移较小,而材质转移和容器图像则引入了更大的分布偏移,增加了分类任务的难度。此外,数据集的构建考虑了考古学领域的专业需求,确保了数据的实用性和科学性。
使用方法
ShiftedBronzes数据集可用于评估细粒度分类和分布外检测方法在青铜器年代鉴定任务中的性能。研究者可以通过训练集、验证集和测试集进行模型训练和评估,并结合七种分布外数据进行分布外检测实验。数据集支持多种方法的评估,包括后处理方法、预训练视觉语言模型方法和生成方法,为研究者提供了全面的实验平台。
背景与挑战
背景概述
ShiftedBronzes数据集由吉林大学人工智能学院和考古学院的研究团队开发,旨在解决开放世界场景中细粒度青铜器年代分类的复杂分布外(OOD)问题。该数据集基于现有的青铜器Ding数据集进行扩展,包含了两种青铜器数据(Ding和Gui)以及七种OOD数据,涵盖了青铜器年代分类中常见的分布偏移情况。ShiftedBronzes数据集的构建不仅填补了考古领域在开放世界场景中缺乏基准研究的空白,还为细粒度视觉分类(FGVC)和OOD检测方法的发展提供了重要的实验平台。通过该数据集,研究人员能够更好地评估和分析现有方法在特定领域任务中的表现,推动青铜器年代分类研究的发展。
当前挑战
ShiftedBronzes数据集面临的挑战主要集中在两个方面:首先,青铜器年代分类任务本身具有高度细粒度的特性,要求模型能够准确区分不同年代的青铜器,尤其是在面对分布偏移的OOD数据时,模型的鲁棒性面临严峻考验。其次,数据集的构建过程中,研究人员需要处理多种类型的OOD数据,如素描图像、拓片图像以及通过零样本材料转移模型生成的图像,这些数据的分布与ID数据存在显著差异,增加了模型检测的难度。此外,如何有效利用领域专家知识对数据进行标注,并在模型训练中充分利用这些知识,也是该数据集面临的另一大挑战。
常用场景
经典使用场景
ShiftedBronzes数据集的经典使用场景主要集中在细粒度青铜器年代鉴定任务中,特别是在开放世界环境中处理分布偏移问题。该数据集通过引入多种类型的分布偏移数据(如素描图像、拓片图像、生成图像等),帮助研究人员评估和改进细粒度分类模型在面对未知分布数据时的鲁棒性。通过对比不同类型的分布偏移数据,研究人员可以更好地理解模型在不同场景下的表现,并为青铜器年代鉴定任务提供更可靠的解决方案。
衍生相关工作
ShiftedBronzes数据集的发布催生了一系列相关研究工作,特别是在细粒度分类和OOD检测领域。许多研究者基于该数据集进行了深入的实验和分析,提出了多种改进的细粒度分类方法和OOD检测算法。例如,一些研究工作通过引入生成模型来增强OOD检测的鲁棒性,而另一些工作则探索了基于视觉-语言模型的OOD检测方法。此外,ShiftedBronzes还激发了对领域特定数据分布偏移的深入研究,推动了OOD检测方法在考古学等领域的应用。这些衍生工作不仅丰富了细粒度分类和OOD检测的理论基础,还为实际应用提供了更多可行的解决方案。
数据集最近研究
最新研究方向
ShiftedBronzes数据集在细粒度分类领域的前沿研究方向主要集中在开放世界场景下的领域细粒度分类问题。该数据集通过引入多种分布偏移的OOD(Out-of-Distribution)数据,挑战了传统封闭世界假设下的分类方法。研究者们通过对比多种OOD检测方法,发现基于视觉语言模型(VLM)的方法在处理领域特定数据时表现尤为突出,尤其是在检测具有较小分布偏移的OOD样本时。此外,生成模型在处理特定类型的OOD数据(如草图和拓片)时也展现出显著优势。这些研究不仅推动了青铜器考古领域的细粒度分类技术发展,还为OOD检测方法在领域特定任务中的应用提供了新的视角和基准。
相关研究论文
  • 1
    ShiftedBronzes: Benchmarking and Analysis of Domain Fine-Grained Classification in Open-World Settings吉林大学 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

ArXiv

ArXiv数据集包含了来自arXiv.org的学术论文元数据,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学等多个领域的研究论文。数据集包括论文的标题、作者、摘要、提交日期、修改日期、DOI(数字对象标识符)等信息。

www.kaggle.com 收录

MeSH

MeSH(医学主题词表)是一个用于索引和检索生物医学文献的标准化词汇表。它包含了大量的医学术语和概念,用于描述医学文献中的主题和内容。MeSH数据集包括主题词、副主题词、树状结构、历史记录等信息,广泛应用于医学文献的分类和检索。

www.nlm.nih.gov 收录

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

Simulation of rear wheel steering in a vehicle towing a single axle trailer with variable load distribution

This is the dataset for a publication on the stability of automotive vehicles when towing single axle trailers. The loading of the trailer is critical for stability, if the load distribution is too far back, then the trailer will begin to sway uncontrollably, dictating the track of the vehicle.In this research, small proportional control of the rear wheel steering of a larger towing vehicle is shown to be able to further stabilize the system easily, thus improving the safety margin. This is based on control measurements of the yaw angle, either directly measured or inferred from rear camera / parking sensor measurements.The simulation environment is Simulink and all scripts are included to initialise and plot the results. The work is based on the built in example "Two axle vehicle towing one axle trailer" with modifications to enable control algorithms for rear wheel steering control and variable load distribution. Reference for the original model is available at:T. M. Inc., Vehicle dynamics blockset version: 2.0 (r2023a) (2022). https://www.mathworks.comT. M. Inc., Trailer body 3dof documentation (2020). https://uk.mathworks.com/help/vdynblks/ref/trailerbody3dof.html<br>

DataCite Commons 收录

PCLT20K

PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。

arXiv 收录