five

FAIR Photos

收藏
github2024-05-14 更新2024-05-31 收录
下载链接:
https://github.com/noord-hollandsarchief/CLARIAH-Data-Call-Fotopersbureau-De-Boer
下载链接
链接失效反馈
官方服务:
资源简介:
Fotopersbureau De Boer收藏因其主题丰富和规模(200万张照片)而特别引人注目。它包含了对环境、能源和社会不平等等当前话题进行研究的有价值材料,并提供了人们日常生活的视角。FAIR Photos项目通过将收藏的元数据与地点、人物和关键词的词汇表链接,进一步开放了该收藏以供研究和文化遗产部门使用。新增的信息被重新整合到档案馆的收藏管理系统中,以确保长期存储的可持续性。此数据提交包含以CSV和RDF格式丰富的元数据。

The Fotopersbureau De Boer collection is particularly notable for its thematic richness and scale (2 million photographs). It contains valuable materials for research on current topics such as the environment, energy, and social inequality, and offers perspectives on people's daily lives. The FAIR Photos project further opens up the collection for use by the research and cultural heritage sectors by linking the collection's metadata to a glossary of places, people, and keywords. The newly added information is reintegrated into the archive's collection management system to ensure the sustainability of long-term storage. This data submission includes enriched metadata in CSV and RDF formats.
创建时间:
2023-03-30
原始信息汇总

数据集概述

数据集名称

FAIR Photos - CLARIAH FAIR Data Call 2023

数据集内容

  • 照片数量:约200万张
  • 主题范围:环境、能源、社会不平等及日常生活等
  • 元数据增强:通过链接位置、人物、关键词的词汇表,增强元数据,以支持研究和文化遗产领域的使用
  • 数据格式:CSV和RDF Turtle

数据模型

  • 基础词汇:schema.org
  • 扩展词汇
    • PNV:用于人物名称(https://w3id.org/pnv)
    • ROAR:用于人物观察和重建(https://w3id.org/roar)

数据文件描述

  1. photographs.csv
    • 包含每张照片的属性及其与其他实体的关系,如报告、人物、位置等
  2. personobservations.csv
    • 包含个人观察的详细信息,仅包括公开人物
  3. personreconstructions.csv
    • 包含个人重建的详细信息,仅包括公开人物
  4. locations.csv
    • 包含位置的详细信息,包括类型和几何信息
  5. concepts.csv
    • 包含主题卡概念的详细信息
  6. tags.csv
    • 包含HisVis AI标签概念的详细信息

数据示例

  • RDF描述:提供了单张照片及其相关资源的RDF描述示例,展示了如何使用schema.org和其他扩展词汇来描述照片及其相关属性

数据集链接

搜集汇总
数据集介绍
main_image_url
构建方式
FAIR Photos数据集的构建基于Fotopersbureau De Boer的200万张照片,这些照片涵盖了广泛的主题,包括环境、能源和社会不平等。数据集的构建过程中,通过将照片的元数据与地名、人物和关键词的分类词典进行关联,进一步丰富了数据的内容。这些新增的信息被重新整合到档案的收藏管理系统中,以确保长期存储的可持续性。数据集的元数据以CSV和RDF格式提供,便于不同领域的研究和文化遗产部门的使用。
使用方法
FAIR Photos数据集提供了CSV和RDF两种格式的数据,用户可以根据需求选择合适的格式进行分析和研究。CSV文件包含了照片的详细信息,如照片的永久链接、标识符、缩略图URL、相关报告的UUID等。RDF格式则提供了更为复杂的语义描述,适合进行深入的语义分析和知识图谱构建。用户可以通过SPARQL查询从RDF数据中提取所需信息,或直接使用CSV文件进行简单的数据处理和分析。
背景与挑战
背景概述
FAIR Photos数据集是由CLARIAH FAIR Data Call 2023项目支持的,旨在丰富Fotopersbureau De Boer摄影档案的元数据。该数据集包含了超过200万张照片,涵盖了环境、能源、社会不平等以及日常生活的多个主题。通过将这些照片的元数据与地名、人物和关键词的词库进行关联,FAIR Photos项目不仅提升了数据的可研究性,还为文化遗产领域提供了宝贵的资源。该项目的主要研究人员和机构包括Noord-Hollands Archief和Fotopersbureau De Boer,其核心研究问题是如何通过元数据增强来提升历史照片的可用性和长期存储的可持续性。
当前挑战
FAIR Photos数据集在构建过程中面临了多个挑战。首先,如何有效地将大量照片的元数据与外部词库进行关联,确保数据的准确性和一致性是一个复杂的问题。其次,数据集中的URI在发布时存在解析问题,尽管UUID是稳定的,但未来的可访问性仍不确定。此外,数据集中仅包含‘公共人物’的信息,这可能导致某些URI在报告中缺乏相关信息,需要进一步的补充和完善。最后,数据模型的复杂性,尤其是涉及多种词汇表(如PNV和ROAR)的扩展,增加了数据处理的难度。
常用场景
经典使用场景
FAIR Photos数据集的经典使用场景主要集中在历史研究、社会学分析以及文化传承领域。通过该数据集,研究者可以深入探索20世纪的环境变迁、能源发展和社会不平等现象。此外,数据集中丰富的照片和关联的元数据为研究者提供了对日常生活的直观洞察,有助于构建更为全面的历史叙事。
解决学术问题
FAIR Photos数据集通过其庞大的照片库和丰富的元数据,解决了历史研究中长期存在的数据稀缺和信息孤立问题。该数据集不仅为学者提供了丰富的研究素材,还通过链接地理位置、人物和关键词等元数据,增强了数据的互操作性和可发现性,从而推动了跨学科研究的深入发展。
实际应用
在实际应用中,FAIR Photos数据集被广泛用于文化机构的历史展览、教育资源的开发以及公众历史意识的提升。例如,博物馆和档案馆可以利用该数据集策划主题展览,教育机构则可以将其用于历史课程的多媒体教学,而公众则可以通过这些照片更好地理解过去的社会生活和历史事件。
数据集最近研究
最新研究方向
近年来,FAIR Photos数据集在文化遗产与社会研究领域展现出显著的前沿性。该数据集通过丰富的元数据链接,特别是与位置、人物和关键词的关联,极大地提升了其在环境、能源和社会不平等研究中的应用潜力。此外,数据集采用的schema.org词汇扩展模型,结合PNV和ROAR等词汇,进一步增强了其在人物观察与重建方面的精确性。这些技术的融合不仅为文化传承提供了新的研究视角,也为社会问题的深入分析奠定了坚实的基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作