TimeTravel
收藏Hugging Face2025-02-21 更新2025-02-22 收录
下载链接:
https://huggingface.co/datasets/MBZUAI/TimeTravel
下载链接
链接失效反馈官方服务:
资源简介:
TimeTravel数据集是一个大规模的开源基准,旨在评估大型多模态模型在历史和文化 artifact上的表现。它包含了10个历史区域中的266个文化群体的超过10000个经过专家验证的artifact样本,是一个多模态的图像-文本数据集,用于支持AI驱动的历史分析和文化遗产研究。
The TimeTravel Dataset is a large-scale open-source benchmark designed to evaluate the performance of large multimodal models on historical and cultural artifacts. It includes over 10,000 expert-validated artifact samples covering 266 cultural groups across 10 historical regions, serving as a multimodal image-text dataset that supports AI-driven historical analysis and cultural heritage research.
提供机构:
Mohamed Bin Zayed University of Artificial Intelligence
创建时间:
2025-02-20
搜集汇总
数据集介绍

构建方式
TimeTravel数据集的构建采取了一个精确且系统化的流程,首先通过专家验证从博物馆藏品中精选出10250件艺术品,涵盖了266个文化群体。随后,对缺失或不完整的元数据进行了清洗,确保了数据的完整性与一致性。通过GPT-4o生成描述并经历史学家和考古学家验证,最后将数据标准化为图像-文本对,形成了一个适用于人工智能驱动的历史分析与文化遗产研究的重要资源。
使用方法
使用TimeTravel数据集,研究者可以依据其提供的详细数据结构,包括图像、ID、生产日期、发现地点、材料、技术、铭文、主题、关联名称、文化、部分、地点和描述等字段,进行历史艺术品的多维度分析。数据集提供了公开的评估框架,支持模型在特定任务上的性能比较,用户可以根据具体的任务需求,选择合适的模型进行训练和评估。
背景与挑战
背景概述
TimeTravel数据集是一项旨在推动大型多模态模型在历史和文化艺术品评估领域发展的开创性工作。该数据集由Sara Ghaboura等研究人员于2025年创建,涵盖了来自10个历史区域、266个文化群体的超过10,000个经过专家验证的艺术品样本。TimeTravel不仅提供了一个多模态图像-文本数据集,用于人工智能驱动的历史研究,而且还提供了一个公开的数据集和评估框架,以促进人工智能在历史学和考古学领域的应用。
当前挑战
TimeTravel数据集在构建过程中面临的挑战主要包括:确保所选取艺术品的多样性和历史准确性,处理缺失或不完整的元数据,以及生成并验证与现实相符的描述。此外,该数据集在研究领域中提出的挑战包括如何有效评估大型多模态模型在理解和描述历史和文化遗产方面的性能,以及如何将这些模型应用于解决实际的历史学和考古学问题。
常用场景
经典使用场景
TimeTravel数据集作为首个大规模开源基准,其经典使用场景在于评估大型多模态模型(LMMs)在历史和文化遗物上的表现。该数据集通过其多模态图像-文本特性,为AI驱动的历史分析和文化遗产研究提供了丰富的资源。
解决学术问题
TimeTravel数据集解决了学术研究中对于历史和文化遗物的高质量、大规模、多样化数据的需求问题。它为研究者提供了跨越不同文明、文化和时期的 artifact 样本,有助于推动历史学、考古学和人工智能领域的交叉融合,提升了对历史材料的理解和分析能力。
实际应用
在实际应用中,TimeTravel数据集可用于文化遗产数字化保护、历史教育资源的开发、智能博物馆导游系统等多个方面。它通过提供标准化的数据结构,促进了历史文化遗产的智能化管理和利用,为公众提供了更加丰富和互动的文化体验。
数据集最近研究
最新研究方向
TimeTravel数据集作为首个大规模开源的基准,旨在评估大型多模态模型(LMMs)在历史和文化遗物上的表现。该数据集映射了来自10个文明、266个文化的超过10,000个经过专家验证的样本,为AI驱动的历史分析提供了宝贵的资源。近期研究聚焦于利用该数据集对历史和考古学领域的人工智能应用进行深化研究,特别是对大型多模态模型在理解历史和文化 artifact 方面的性能评估,推动了AI技术在文化遗产保护和解读中的前沿应用。
以上内容由遇见数据集搜集并总结生成



