five

mabidan/ganjoor

收藏
Hugging Face2024-05-19 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/mabidan/ganjoor
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了伊朗伟大诗人多年来的几乎所有诗歌。原始数据库为表格形式,已转换为CSV格式,包含以下列:id(原数据库中的诗歌ID)、poem(诗歌名称)、poet(诗人名称)、cat(诗歌类别)、text(诗歌文本和诗句)。

该数据集包含了伊朗伟大诗人多年来的几乎所有诗歌。原始数据库为表格形式,已转换为CSV格式,包含以下列:id(原数据库中的诗歌ID)、poem(诗歌名称)、poet(诗人名称)、cat(诗歌类别)、text(诗歌文本和诗句)。
提供机构:
mabidan
原始信息汇总

数据集概述

基本信息

  • 名称: Ganjoor - Persian Poem Corpus
  • 许可证: Creative Commons Attribution 4.0 International (cc-by-4.0)
  • 语言: 波斯语(Farsi)
  • 标签: 波斯语、语料库、诗歌、文本
  • 大小: 100K<n<1M

数据集描述

  • 内容: 包含伊朗众多伟大诗人的几乎所有诗歌,时间跨度从过去直到现在。
  • 结构: 原始数据库为表格格式,转换为CSV格式,包含以下列:
    • id: 诗歌在原始数据库中的ID
    • poem: 诗歌名称
    • poet: 诗人名称
    • cat: 诗歌类别
    • text: 诗歌文本和诗句

使用说明

  • 加载示例: 使用datasets库加载数据集,如load_dataset("mabidan/ganjoor")

注意事项

  • 数据完整性: 部分诗歌可能无文本内容,建议在使用前检查并剔除这些记录。

联系方式

  • 联系人: Navid Abbaspoor
  • 邮箱: navidabbaspoor@gmail.com
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作