five

andreamorgar/spanish_poetry

收藏
Hugging Face2022-03-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/andreamorgar/spanish_poetry
下载链接
链接失效反馈
官方服务:
资源简介:
Spanish Poetry Dataset是一个包含西班牙语诗歌的数据集,旨在为NLP任务提供高质量的西班牙语数据。该数据集是在PyConES2020会议上为诗歌生成任务而构建的。数据集的内容是从www.poemas-del-alma.com网页上获取的,包括诗人的名字、诗歌内容和诗歌标题。数据是通过Python的BeautifulSoup库进行爬取的。数据集的语言为西班牙语。
提供机构:
andreamorgar
原始信息汇总

Spanish Poetry Dataset 概述

数据集描述

  • 名称: Spanish Poetry Dataset
  • 目的: 为NLP任务提供高质量的西班牙语诗歌数据,特别为PyConES2020会议的诗歌生成任务构建。
  • 内容: 数据集包含从www.poemas-del-alma.com网站于2020年7月采集的西班牙语诗歌。每条数据包括诗人的名字、诗歌内容及其标题。
  • 数据获取方式: 使用Python库BeautifulSoup进行网页抓取。
  • 语言: 西班牙语

作者

  • Andrea Morales (@andreamorgar)
  • Miguel López (@wizmik12)

许可证

  • GPL-3.0

致谢

  • 感谢www.poemas-del-alma.com提供诗歌数据。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作