five

Text of Wikisource pages of German magazine 'Die Gartenlaube'

收藏
NIAID Data Ecosystem2026-03-13 收录
下载链接:
https://zenodo.org/record/5781725
下载链接
链接失效反馈
官方服务:
资源简介:
Text of all Gartenlaube pages transcribed in German Wikisource. Text parsed on 2021-12-13, the output is combinend in separeted json files, each file per volume, starting 1853 and ending 1899. All 47 json files are compressed into one *.tar.xz file. The syntax of the json looks like: [{"pageid" : {PAGEID}, "title" : {PAGETITLE}, "lastrevid" : {REVISIONID}, "proofread" : {{JSON_OBJECT_Proofread_Status}} "html" : {HTML_OUTPUT}, "wikitext": {WIKI_MARKUP}, "plaintxt": {mwparserfromhell(WIKI_MARKUP).strip_code)} }]
创建时间:
2021-12-31
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作