Chronological Persian Poetry Dataset
收藏github2023-06-25 更新2024-05-31 收录
下载链接:
https://github.com/aghasemi/ChronologicalPersianPoetryDataset
下载链接
链接失效反馈官方服务:
资源简介:
一个关于波斯诗歌的时序数据集,数据按诗人生活的世纪进行排序,从Ganjoor数据库中提取。
A temporal dataset on Persian poetry, organized by the century in which the poets lived, extracted from the Ganjoor database.
创建时间:
2017-03-06
原始信息汇总
Chronological Persian Poetry Dataset 概述
数据集描述
- 名称: Chronological Persian Poetry Dataset
- 来源: 从 Ganjoor 数据库提取的波斯诗歌数据。
- 时间范围: 数据集涵盖了诗人生活的世纪。
数据集应用
- 可视化工具: 提供了一个基本的 streamlit 网页应用程序,用于数据的可视化和浏览。
- 部署平台: 该应用程序通过 streamlit sharing platform 部署在 https://share.streamlit.io/aghasemi/ppngram/app.py。
搜集汇总
数据集介绍

构建方式
Chronological Persian Poetry Dataset的构建基于Ganjoor数据库,该数据库是一个广泛收录波斯诗歌的权威资源。数据集按照诗人生活的世纪进行时间顺序排列,确保了数据的时序性和历史准确性。通过从Ganjoor中提取并整理诗歌内容,数据集不仅保留了原始文本的完整性,还通过时间维度的分类,为研究者提供了更为清晰的历史脉络。
特点
该数据集的特点在于其时间顺序的排列方式,使得研究者能够按照世纪为单位,追溯波斯诗歌的演变历程。数据集涵盖了多个世纪的诗歌作品,反映了不同历史时期的文化背景和文学风格。此外,数据集还提供了一个基于streamlit的网页应用,用户可以通过该应用直观地浏览和可视化数据,进一步增强了数据的可访问性和交互性。
使用方法
使用Chronological Persian Poetry Dataset时,研究者可以通过访问其GitHub页面获取数据,并利用提供的streamlit网页应用进行数据浏览和可视化。该应用允许用户按世纪筛选诗歌,查看特定时期的作品,并通过图表等形式分析诗歌的演变趋势。数据集的结构化格式也便于进行文本分析和历史研究,为波斯文学的研究提供了丰富的素材。
背景与挑战
背景概述
Chronological Persian Poetry Dataset 是一个按诗人生活年代排序的波斯诗歌数据集,数据来源于著名的Ganjoor数据库。该数据集由研究人员Aghasemi等人于2021年创建,旨在为波斯文学研究提供一个按时间顺序排列的诗歌资源。Ganjoor数据库本身是一个广泛使用的波斯文学资源,包含了大量的波斯诗歌和文学作品。通过这一数据集,研究者可以更系统地分析波斯诗歌的历史演变、风格变化及其文化背景。该数据集的发布不仅为波斯文学研究提供了新的视角,也为自然语言处理和文本挖掘领域的研究者提供了宝贵的数据资源。
当前挑战
Chronological Persian Poetry Dataset 面临的挑战主要集中在两个方面。首先,波斯诗歌的文本结构复杂,包含大量的隐喻、象征和古典修辞手法,这对自然语言处理模型的理解和分析提出了较高的要求。其次,数据集的构建过程中,如何准确地将诗歌按年代分类是一个技术难题,尤其是对于年代久远的诗歌,历史记录的缺失可能导致分类的不准确。此外,波斯语的语法和词汇在不同历史时期有所变化,这也增加了数据预处理和标注的难度。尽管数据集提供了一个基本的可视化工具,但如何进一步优化数据处理流程,提升模型的性能,仍是未来研究的重要方向。
常用场景
经典使用场景
Chronological Persian Poetry Dataset 数据集在文学研究和历史语言学领域具有重要应用,特别是在波斯诗歌的编年史研究中。该数据集通过按诗人生活的世纪进行诗歌分类,为研究者提供了一个时间线上的诗歌发展脉络,便于分析不同历史时期的文学风格和语言演变。
实际应用
在实际应用中,Chronological Persian Poetry Dataset 被广泛用于波斯文学的教学和研究。教育机构可以利用该数据集进行波斯诗歌的历史教学,帮助学生理解不同时期的文学特点。此外,该数据集还被用于开发波斯文学的数字人文项目,如诗歌可视化工具和在线诗歌数据库。
衍生相关工作
基于该数据集,研究者开发了多个相关工具和平台,如基于 Streamlit 的诗歌可视化应用。这些工具不仅增强了数据的可访问性,还为波斯诗歌的研究提供了新的视角。此外,该数据集还激发了更多关于波斯文学数字化的研究,推动了波斯文学研究的现代化进程。
以上内容由遇见数据集搜集并总结生成



