five

Magister Dixit Collection Dataset

收藏
github2023-08-08 更新2024-05-31 收录
下载链接:
https://github.com/KULeuvenDigitalisering/Magister-Dixit-Collection-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
Magister Dixit Collection数据集包含552份古老大学Leuven的手写讲义笔记,作为开放数据提供给数字人文研究和其他创意活动使用。该数据集是历史研究的重要资源,提供了大学组织、课程和科目的生动画面。

The Magister Dixit Collection dataset comprises 552 handwritten lecture notes from the ancient University of Leuven, made available as open data for digital humanities research and other creative endeavors. This dataset serves as a vital resource for historical studies, offering a vivid portrayal of university organization, curricula, and subjects.
创建时间:
2020-08-05
原始信息汇总

数据集概述

数据集名称

  • 名称: Magister Dixit Collection Dataset
  • 描述: 该数据集包含Magister Dixit Collection的全部手写讲义笔记,这些笔记来自古老的鲁汶大学(1425-1797年),作为开放数据供数字人文和其他创意使用。

数据集内容

  • 包含内容: 552份讲义笔记的手稿,这些手稿保存在不同的图书馆中,已完全数字化并虚拟收集。
  • 主要来源: 主要来自艺术学院,这是进入医学、神学或法律等“高级”学院的必要学术学位。
  • 历史价值: 提供鲁汶大学组织、课程和科目的生动画面,包括学生、教授和与大学合作的专业人士的信息。

数据集结构

  • 类型: 描述性元数据仓库,代表当前虚拟收藏中的所有552份手稿。
  • 元数据: 包含552条记录,共27列,涵盖记录ID、URL、日期、国家、语言、标题、物理描述、内容类型、媒体类型、载体类型等。
  • 下载方式: 可通过GitHub或Zenodo下载CSV文件。

使用许可

  • 许可类型: 公共领域标记(PDM)
  • 使用条件: 数据集不受版权限制,可自由使用,但需提及“KU Leuven. Magister Dixit Collection”。

引用信息

  • 引用格式: KU Leuven Libraries, Digitisation Department. (2020). Magister Dixit Collection [Dataset]. Zenodo. http://doi.org/10.5281/zenodo.3973116.
  • DOI: 10.5281/zenodo.3973116

技术细节

  • 文件格式: CSV
  • 元数据标准: MARC 21
  • 数据清理与转换: 使用OpenRefine软件进行。

使用对象

  • 目标用户: 数字人文研究者、学者、学生和教师,用于创意再利用、数据可视化和算法处理。

数据集增长

  • 更新状态: 数据集仍在增长,涉及的图书馆和私人收藏者持续增加。

示例应用

  • 应用案例: Magister Dixit Metadata Exploration项目,包括修改后的CSV文件和Jupyter Notebook示例。

贡献与反馈

  • 贡献方式: 通过GitHub上的all-contributors规范,欢迎各种形式的贡献。
  • 反馈机制: 鼓励用户分享使用该数据集的创意方式,以便展示数字文化遗产的更多创意再利用示例。
搜集汇总
数据集介绍
main_image_url
构建方式
Magister Dixit Collection Dataset的构建基于鲁汶大学(1425-1797)的552份手写讲稿,这些手稿分散于多个图书馆,经过数字化处理后整合为一个虚拟收藏。该数据集通过KU Leuven图书馆的Alma数字保存环境获取元数据,并使用OpenRefine软件进行清洗和转换,最终生成了包含描述性元数据和数字资源链接的CSV文件。
使用方法
用户可通过GitHub或Zenodo下载CSV文件,文件格式为UTF-8编码,建议使用Excel进行导入和查看。数据集适用于数字人文研究、数据可视化及算法处理,用户可通过LIMO发现界面或Lectio页面进一步探索数字化收藏。引用数据集时需注明其DOI,并遵循公共领域标记(PDM)许可协议。
背景与挑战
背景概述
Magister Dixit Collection Dataset 是由鲁汶大学图书馆于2020年发布的一个开放数据集,旨在为数字人文研究提供丰富的资源。该数据集包含了552份手稿的元数据,这些手稿源自1425年至1797年间鲁汶大学的课堂笔记,涵盖了艺术学院的课程内容及其相关历史背景。这些手稿不仅记录了当时的教学组织和课程设置,还提供了关于学生、教授以及与大学合作的各类专业人士的详细信息。该数据集由鲁汶大学图书馆的数字化部门主导,联合了多个图书馆和私人收藏家的资源,形成了一个虚拟的数字化收藏。其发布为研究早期大学教育、文化史以及手稿学提供了宝贵的原始资料。
当前挑战
Magister Dixit Collection Dataset 在构建和应用过程中面临多重挑战。首先,手稿的数字化和元数据提取需要克服技术难题,尤其是手写文本的识别和分类。其次,由于手稿来源多样,且保存状态不一,如何确保数据的一致性和完整性成为一大挑战。此外,尽管数据集提供了丰富的元数据,但其多语言和多格式的特性使得数据整合和分析变得复杂。最后,如何将这些历史数据与现代数字人文研究方法有效结合,以挖掘更深层次的历史和文化信息,也是研究者需要面对的重要问题。
常用场景
经典使用场景
Magister Dixit Collection Dataset 主要用于数字人文领域的研究,特别是对鲁汶大学(1425-1797)历史文献的深入分析。该数据集包含了552份手写讲稿的元数据,涵盖了艺术学院的课程内容、学生生活以及教授和专业人士的详细信息。研究者可以通过这些数据探索中世纪大学的组织结构、课程设置以及学术交流的历史背景。
解决学术问题
该数据集为研究鲁汶大学的历史提供了宝贵的原始资料,解决了中世纪高等教育历史研究中数据稀缺的问题。通过分析这些手稿,学者们能够更深入地理解当时的学术体系、教学方法和知识传播方式。此外,数据集还为跨学科研究提供了基础,如历史学、文学、艺术史等领域的学者可以通过这些数据开展合作研究。
实际应用
在实际应用中,Magister Dixit Collection Dataset 被广泛用于数字人文项目的开发,如数据可视化、文本挖掘和机器学习算法的训练。例如,研究者可以利用这些数据进行手写文字识别、文本分类和主题建模,从而揭示中世纪学术文献中的知识结构和演变趋势。此外,该数据集还被用于教育领域,帮助学生和教师更好地理解历史文献的价值和研究方法。
数据集最近研究
最新研究方向
在数字人文领域,Magister Dixit Collection Dataset为研究鲁汶大学(1425-1797)的历史提供了丰富的资源。该数据集包含了552份手写讲义的数字化版本,涵盖了艺术学院的课程内容,反映了当时的教育体系和社会结构。近年来,研究者们利用该数据集进行文本挖掘、社会网络分析和可视化研究,探索中世纪至近代早期的知识传播路径、学术网络构建以及教育制度的演变。此外,结合机器学习技术,研究者还尝试对古文字进行自动识别和转录,进一步推动了数字档案的智能化处理。这一数据集不仅为历史学者提供了新的研究视角,也为跨学科合作开辟了广阔的前景。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作