five

A _P-1554-Lazarillo-I.txt

收藏
DataCite Commons2022-03-02 更新2025-04-09 收录
下载链接:
https://hdl.handle.net/21.11113/0000-000E-8BE9-F
下载链接
链接失效反馈
官方服务:
资源简介:
Diese Textsammlung enthält literarische Werke unterschiedlicher Gattungen und Autoren in spanischer Originalsprache aus dem Zeitraum des 16. bis 17. Jahrhunderts. Die Sammlung wurde anlässlich zweier stilometrischer Studien zur Autorschaft des "Quijote apocrífo" erstellt: "Avellaneda y los problemas de la identificación del autor. Propuestas para una investigación con nuevas herramientas digitales" (https://nbn-resolving.org/urn:nbn:de:bvb:384-opus4-37049) und "Die Digitalisierung des goldenen Zeitalters – Editionsproblematik und stilometrische Autorschaftsattribution am Beispiel des Quijote" (http://dx.doi.org/10.17175/2018_004). Die insgesamt 96 Texte sind gemeinfrei zugänglich und wurden aus unterschiedlichen digitalen Bibliotheken gesammelt. Zum großen Teil stammen die Texte von Biblioteca Virtual Miguel Cervantes oder Wikisource. Zur Sammlung wird eine Metadatentabelle mit bibliographischen Angaben und Informationen zu den Gattungen veröffentlicht. Die Texte liegen im Reintextformat (UTF-8 codiert) vor und wurden nur minimal bereinigt. Es befinden sich z.T. noch Paratexte (Vorwort, Widmung, etc.) in den einzelnen Textdateien. Die Benennung der Dateien entspricht leider keinem einheitlichen Prinzip, weil sie für unterschiedliche digitale Untersuchungen verwendet wurden.

本文本数据集收录了16至17世纪不同体裁、不同作者的西班牙语原创文学作品。本数据集的构建旨在支撑两项针对伪《堂吉诃德》(Quijote apocrífo)作者身份的文体计量学研究,分别为《阿韦利亚内达与作者身份识别难题——基于新型数字工具的研究构想》(https://nbn-resolving.org/urn:nbn:de:bvb:384-opus4-37049)与《黄金时代数字化——以〈堂吉诃德〉为例的版本编纂难题与文体计量学作者归属》(http://dx.doi.org/10.17175/2018_004)。本数据集共包含96篇公有领域文本,采集自多个数字图书馆,其中大部分来源于米格尔·德·塞万提斯虚拟图书馆(Biblioteca Virtual Miguel Cervantes)与维基文库(Wikisource)。本数据集将同步发布一份元数据表,内含各作品的书目信息与体裁分类说明。所有文本均以纯文本格式(UTF-8编码)存储,仅经过极少量的预处理,部分文本文件中仍保留有副文本(如前言、献词等)。遗憾的是,本数据集的文件命名未遵循统一规则,因这些文件最初被用于多项不同的数字研究项目。
提供机构:
DARIAH-DE
创建时间:
2022-03-02
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作