jorge-henao/disco_poetry_spanish
收藏Hugging Face2022-03-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/jorge-henao/disco_poetry_spanish
下载链接
链接失效反馈官方服务:
资源简介:
DISCO数据集是一个包含15世纪至20世纪西班牙语十四行诗的语料库,涵盖了1215位来自22个不同国家的作者创作的4303首十四行诗。数据集以CSV格式提供,包含标题、作者、年代和文本等元数据。该数据集不仅包括知名作者的作品,也包含较少被经典化的作者的作品。
# DISCO:历时西班牙语十四行诗语料库(Diachronic Spanish Sonnet Corpus,简称DISCO)
[](https://zenodo.org/badge/latestdoi/103841064)
该语料库以CSV格式收录了15至20世纪的西班牙语十四行诗,涵盖来自22个国家的1215位作者的4303首作品。该语料库既收录了广为人知的经典诗人,也包含未被充分纳入文学正典的创作者。
本次发布的CSV格式数据集源自GitHub平台上发布的纯文本语料库v4(仓库地址:https://github.com/pruizf/disco/tree/v4),该数据集包含标题、作者、创作年代及文本元数据。
提供机构:
jorge-henao
原始信息汇总
DISCO: Diachronic Spanish Sonnet Corpus
数据集概述
- 名称: Diachronic Spanish Sonnet Corpus (DISCO)
- 内容: 包含15世纪至20世纪的西班牙语十四行诗,共计4303首,由1215位来自22个不同国家的作者创作。
- 格式: CSV
- 包含信息: 标题、作者、时代和文本元数据
- 来源: 从GitHub上的plain text corpus v4编译而来,地址为https://github.com/pruizf/disco/tree/v4。



