five

Textos literarios del Siglo de Oro

收藏
DataCite Commons2022-03-02 更新2025-04-09 收录
下载链接:
https://hdl.handle.net/21.11113/0000-000E-8B9A-8
下载链接
链接失效反馈
官方服务:
资源简介:
Esta es una colección de textos literarios, escritos por varios autores del siglo de oro y pertenecientes a diferentes géneros literarios. Los fuentes bibliográficos y los géneros literarios son listados en la tabla de metadatos. Fue creada y analizada en los artículos "Die Digitalisierung des goldenen Zeitalters – Editionsproblematik und stilometrische Autorschaftsattribution am Beispiel des Quijote" (http://dx.doi.org/10.17175/2018_004) y „Avellaneda y los problemas de la identificación del autor. Propuestas para una investigación con nuevas herramientas digitales" (https://nbn-resolving.org/urn:nbn:de:bvb:384-opus4-37049). Los 96 textos se encuentran en dominio público, son de acceso libre y la mayoría de ellos proceden de la Biblioteca Virtual Miguel de Cervantes o de Wikisource. Los textos han sido modificados mínimamente (por ejemplo en eliminando la cabacera o carácteres especiales) y convertidos en texto plano (txt, con codificación UTF-8). En algunos casos todavía se encuentran ciertos paratextos, por ejemplo al comienzo del texto. Los archivos se encuentran tal y como fueron utilizados en proyectos anteriores, por lo que los nombres de los documentos no están normalizados.

本数据集收录了一批文学文本,其作者均为西班牙黄金世纪(siglo de oro)的多位作家,文本涵盖各类文学体裁。文献来源与文学体裁均已在元数据表中列明。本数据集的构建与分析相关研究见于以下两篇学术论文:《Die Digitalisierung des goldenen Zeitalters – Editionsproblematik und stilometrische Autorschaftsattribution am Beispiel des Quijote》(http://dx.doi.org/10.17175/2018_004)与《Avellaneda y los problemas de la identificación del autor. Propuestas para una investigación con nuevas herramientas digitales》(https://nbn-resolving.org/urn:nbn:de:bvb:384-opus4-37049)。本数据集包含96篇文本,均处于公有领域(dominio público),可免费获取;其中大部分文本来源于塞万提斯虚拟图书馆(Biblioteca Virtual Miguel de Cervantes)与维基文库(Wikisource)。所有文本均经过极小幅度的修改(例如移除页眉或特殊字符),并转换为纯文本格式(txt,编码为UTF-8)。部分文本中仍保留有部分副文本(paratextos),例如位于文本开头的内容。本数据集所使用的文件与此前项目中的版本一致,因此文档名称未经过标准化处理。
提供机构:
DARIAH-DE
创建时间:
2022-03-02
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作