mabidan/ganjoor
收藏Hugging Face2024-05-19 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/mabidan/ganjoor
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了伊朗伟大诗人多年来的几乎所有诗歌。原始数据库为表格形式,已转换为CSV格式,包含以下列:id(原数据库中的诗歌ID)、poem(诗歌名称)、poet(诗人名称)、cat(诗歌类别)、text(诗歌文本和诗句)。
该数据集包含了伊朗伟大诗人多年来的几乎所有诗歌。原始数据库为表格形式,已转换为CSV格式,包含以下列:id(原数据库中的诗歌ID)、poem(诗歌名称)、poet(诗人名称)、cat(诗歌类别)、text(诗歌文本和诗句)。
提供机构:
mabidan
原始信息汇总
数据集概述
基本信息
- 名称: Ganjoor - Persian Poem Corpus
- 许可证: Creative Commons Attribution 4.0 International (cc-by-4.0)
- 语言: 波斯语(Farsi)
- 标签: 波斯语、语料库、诗歌、文本
- 大小: 100K<n<1M
数据集描述
- 内容: 包含伊朗众多伟大诗人的几乎所有诗歌,时间跨度从过去直到现在。
- 结构: 原始数据库为表格格式,转换为CSV格式,包含以下列:
- id: 诗歌在原始数据库中的ID
- poem: 诗歌名称
- poet: 诗人名称
- cat: 诗歌类别
- text: 诗歌文本和诗句
使用说明
- 加载示例: 使用
datasets库加载数据集,如load_dataset("mabidan/ganjoor")。
注意事项
- 数据完整性: 部分诗歌可能无文本内容,建议在使用前检查并剔除这些记录。
联系方式
- 联系人: Navid Abbaspoor
- 邮箱: navidabbaspoor@gmail.com



