five

Literary Texts of the Spanish Golden Age

收藏
DataCite Commons2022-03-02 更新2025-04-09 收录
下载链接:
https://hdl.handle.net/21.11113/0000-000E-8BAD-3
下载链接
链接失效反馈
官方服务:
资源简介:
Diese Textsammlung enthält literarische Werke unterschiedlicher Gattungen und Autoren in spanischer Originalsprache aus dem Zeitraum des 16. bis 17. Jahrhunderts. Die Sammlung wurde anlässlich zweier stilometrischer Studien zur Autorschaft des "Quijote apocrífo" erstellt: "Avellaneda y los problemas de la identificación del autor. Propuestas para una investigación con nuevas herramientas digitales" (https://nbn-resolving.org/urn:nbn:de:bvb:384-opus4-37049) und "Die Digitalisierung des goldenen Zeitalters – Editionsproblematik und stilometrische Autorschaftsattribution am Beispiel des Quijote" (http://dx.doi.org/10.17175/2018_004). Die insgesamt 96 Texte sind gemeinfrei zugänglich und wurden aus unterschiedlichen digitalen Bibliotheken gesammelt. Zum großen Teil stammen die Texte von Biblioteca Virtual Miguel Cervantes oder Wikisource. Zur Sammlung wird eine Metadatentabelle mit bibliographischen Angaben und Informationen zu den Gattungen veröffentlicht. Die Texte liegen im Reintextformat (UTF-8 codiert) vor und wurden nur minimal bereinigt. Es befinden sich z.T. noch Paratexte (Vorwort, Widmung, etc.) in den einzelnen Textdateien. Die Benennung der Dateien entspricht leider keinem einheitlichen Prinzip, weil sie für unterschiedliche digitale Untersuchungen verwendet wurden.

本文本数据集收录了16至17世纪、不同体裁与作者的西班牙语原创文学作品。本数据集的构建基于两项针对伪《堂吉诃德》(Quijote apocrífo)作者身份的文体计量学研究:分别为《阿韦利亚内达与作者识别难题——基于新型数字工具的研究提案》(Avellaneda y los problemas de la identificación del autor. Propuestas para una investigación con nuevas herramientas digitales,https://nbn-resolving.org/urn:nbn:de:bvb:384-opus4-37049)与《黄金时代数字化——以〈堂吉诃德〉为例谈版本编纂问题与文体计量学作者归属》(Die Digitalisierung des goldenen Zeitalters – Editionsproblematik und stilometrische Autorschaftsattribution am Beispiel des Quijote,http://dx.doi.org/10.17175/2018_004)。本次收录的96篇文本均处于公有领域,采集自多家不同的数字图书馆。其中绝大多数文本来源于米格尔·德·塞万提斯虚拟图书馆(Biblioteca Virtual Miguel Cervantes)与维基文库(Wikisource)。本数据集将同步发布一份元数据表,其中包含各文本的文献著录信息与体裁分类说明。所有文本均采用纯文本格式(UTF-8编码)存储,且仅经过了最低限度的文本清洗处理。部分单篇文本文件中仍残留有副文本内容,例如前言、献词等。遗憾的是,本数据集的文件命名未遵循统一规则,这是由于这些文本曾被用于多项不同的数字研究工作。
提供机构:
DARIAH-DE
创建时间:
2022-03-02
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作