five

Jinshi dataset

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/ZJU-DAILY/AIstorian
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为“进士”,是一个包含真实历史信息的数据库,其中记录了173位中国历史人物的传记,同时还包含了一个古代中文文本的知识库,总计约22万中文字符。该数据集被划分为训练集和测试集,比例约为8:2。规模上,它涵盖了173位历史人物的传记以及大约22万字符。该数据集的任务是生成人物传记。

This dataset is named "Jinshi". It is a database containing authentic historical information, which records the biographies of 173 Chinese historical figures and includes a knowledge base of ancient Chinese texts, with a total of approximately 220,000 Chinese characters. This dataset is split into a training set and a test set with an approximate split ratio of 8:2. In terms of scale, it covers the biographies of 173 historical figures and approximately 220,000 characters. The task of this dataset is biography generation.
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作