five

Cervantes_N-1613-espanola inglesa.txt

收藏
DataCite Commons2022-03-02 更新2025-04-09 收录
下载链接:
https://hdl.handle.net/21.11113/0000-000E-8B97-B
下载链接
链接失效反馈
官方服务:
资源简介:
This collection of literary works contains texts of several different genre and authors from the 16th to 17th century in Spain (in catellano). Detailled information regarding the genres and bibliographic references are given in the metadata table. The collection was created for the papers: "Avellaneda y los problemas de la identificación del autor. Propuestas para una investigación con nuevas herramientas digitales" (https://nbn-resolving.org/urn:nbn:de:bvb:384-opus4-37049) and "Die Digitalisierung des goldenen Zeitalters – Editionsproblematik und stilometrische Autorschaftsattribution am Beispiel des Quijote" (http://dx.doi.org/10.17175/2018_004). All in all 96 texts are coming from public domain and different digital libraries, mostly the Biblioteca Virtual Miguel de Cervantes or Wikisource. They were transferred into plain text format (UTF-8) but only minimally cleaned. Some of the texts still have paratexts (prelimanary notes, dedications etc.

本文学作品集收录了16至17世纪西班牙地区多位作者创作的多种体裁文本,语言为卡斯蒂利亚语(Castellano)。数据集的元数据表中详细提供了文本体裁与文献著录信息。本数据集依托两篇学术论文构建:《阿维拉内达与作者识别难题:基于新型数字工具的研究方案》(原标题:Avellaneda y los problemas de la identificación del autor. Propuestas para una investigación con nuevas herramientas digitales,链接:https://nbn-resolving.org/urn:nbn:de:bvb:384-opus4-37049)与《黄金时代数字化——以〈堂吉诃德〉为例谈版本编纂问题与文体计量学作者归属》(原标题:Die Digitalisierung des goldenen Zeitalters – Editionsproblematik und stilometrische Autorschaftsattribution am Beispiel des Quijote,链接:http://dx.doi.org/10.17175/2018_004)。整体而言,96篇文本均来自公有领域与不同数字图书馆,主要来源为米格尔·德·塞万提斯虚拟图书馆(Biblioteca Virtual Miguel de Cervantes)与维基文库(Wikisource)。所有文本均已转换为纯文本格式(UTF-8编码),仅做了最低限度的清洗处理。部分文本仍保留有副文本内容(如前置说明、献词等)
提供机构:
DARIAH-DE
创建时间:
2022-03-02
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作