古诗词
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/ABear/Poetry_CN
下载链接
链接失效反馈官方服务:
资源简介:
该数据集来源于国学迷网、读古诗词网、古诗句网与古诗文网对中国古代诗歌的整理,包含诗文、译文、注释、赏析等内容。可用于语言建模、文本生成等训练任务。
This dataset is sourced from the curated ancient Chinese poetry collections of four online platforms: Guoxue Mi Website, Du Gushi Website, Gu Shiju Website and Gu Shiwen Website. It includes poetry texts, translations, annotations and critical appreciations, and can be used for training tasks including language modeling and text generation.
提供机构:
ABear
创建时间:
2023-07-20
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个大规模的中文古诗词集合,来源于国学迷网、读古诗词网等四个网站,包含诗文、译文、注释和赏析等内容,总计7.1GB、20.2k个文件。它适用于语言建模和文本生成等自然语言处理任务,数据以JSONL格式组织,提供了丰富的上下文信息。
以上内容由遇见数据集搜集并总结生成



