Nerwip Corpus v4 - Data
收藏DataCite Commons2020-09-04 更新2024-07-25 收录
下载链接:
https://figshare.com/articles/dataset/Nerwip_Corpus_v4_Data/1318733/2
下载链接
链接失效反馈官方服务:
资源简介:
Set of 409 biographic articles extracted from Wikipedia. Most of them are represented by 5 different files : text only, text and hyperlinks, annotations, meta-data, and html.
本数据集收录了从维基百科(Wikipedia)中提取的409篇传记类文章。绝大多数样本对应5种不同格式的文件:纯文本文件、包含超链接的文本文件、标注文件、元数据(meta-data)文件以及HTML文件。
提供机构:
figshare
创建时间:
2016-01-19



