five

国学迷:古籍

收藏
OpenDataLab2026-06-07 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/ABear/Classics_Ancient_CN
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集来源于国学迷(www.guoxuemiwang.com)古籍栏目下的书籍文本数据,分为史、集、子、诗、儒、易、艺、医、丛、道、佛等部。

This dataset is derived from the book text data in the Ancient Books section of the Guoxuemi website (www.guoxuemiwang.com). It is categorized into multiple sections including History, Literary Collections, Philosophical Works, Poetry, Confucian Classics, Classic of Changes, Arts, Medicine, Collected Series Works, Taoist Classics, and Buddhist Classics.
提供机构:
ABear
创建时间:
2023-07-20
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是国学迷古籍栏目的文本集合,涵盖史、集、子、诗、儒、易、艺、医、丛、道、佛等多个部类,包含22.3万条数据,总计2.33GB。它专为自然语言处理任务设计,如完型填空、语言建模和文本生成,提供了丰富的古籍内容示例,适用于中文语言模型的训练和开发。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务