Literary Texts of the Spanish Golden Age
收藏DataCite Commons2022-03-02 更新2025-04-09 收录
下载链接:
https://hdl.handle.net/21.11113/0000-000E-8C46-6
下载链接
链接失效反馈官方服务:
资源简介:
Diese Textsammlung enthält literarische Werke unterschiedlicher Gattungen und Autoren in spanischer Originalsprache aus dem Zeitraum des 16. bis 17. Jahrhunderts. Die Sammlung wurde anlässlich zweier stilometrischer Studien zur Autorschaft des "Quijote apocrífo" erstellt: "Avellaneda y los problemas de la identificación del autor. Propuestas para una investigación con nuevas herramientas digitales" (https://nbn-resolving.org/urn:nbn:de:bvb:384-opus4-37049) und "Die Digitalisierung des goldenen Zeitalters – Editionsproblematik und stilometrische Autorschaftsattribution am Beispiel des Quijote" (http://dx.doi.org/10.17175/2018_004). Die insgesamt 96 Texte sind gemeinfrei zugänglich und wurden aus unterschiedlichen digitalen Bibliotheken gesammelt. Zum großen Teil stammen die Texte von Biblioteca Virtual Miguel Cervantes oder Wikisource. Zur Sammlung wird eine Metadatentabelle mit bibliographischen Angaben und Informationen zu den Gattungen veröffentlicht. Die Texte liegen im Reintextformat (UTF-8 codiert) vor und wurden nur minimal bereinigt. Es befinden sich z.T. noch Paratexte (Vorwort, Widmung, etc.) in den einzelnen Textdateien. Die Benennung der Dateien entspricht leider keinem einheitlichen Prinzip, weil sie für unterschiedliche digitale Untersuchungen verwendet wurden.
本文本数据集收录16至17世纪期间、由不同作者创作的各类体裁西班牙语文原创文学作品。本数据集专为两项针对《伪续堂吉诃德》(Quijote apocrífo)作者身份的文体计量学研究而构建:其一为《Avellaneda y los problemas de la identificación del autor. Propuestas para una investigación con nuevas herramientas digitales》(https://nbn-resolving.org/urn:nbn:de:bvb:384-opus4-37049),其二为《Die Digitalisierung des goldenen Zeitalters – Editionsproblematik und stilometrische Autorschaftsattribution am Beispiel des Quijote》(http://dx.doi.org/10.17175/2018_004)。本数据集共收录96篇公有领域文本,从多家数字图书馆采集而来,其中绝大多数源自米格尔·德·塞万提斯虚拟图书馆(Biblioteca Virtual Miguel Cervantes)与维基文库(Wikisource)。本数据集将同步发布一份元数据表,包含各文本的书目信息与体裁分类信息。所有文本均采用UTF-8编码的纯文本格式存储,仅经过极少量预处理;部分单个文本文件中仍保留有副文本(如前言、献词等)。遗憾的是,本数据集的文件命名未遵循统一规范,因这些文件最初用于多项不同的数字研究项目。
提供机构:
DARIAH-DE
创建时间:
2022-03-02



