xusenlin/people-daily-ner
收藏Hugging Face2022-12-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/xusenlin/people-daily-ner
下载链接
链接失效反馈官方服务:
资源简介:
人民日报命名实体识别数据集包含文本和实体两个主要特征。文本特征为字符串类型,实体特征包括id(整型)、entity(字符串类型)、start_offset(整型)、end_offset(整型)和label(字符串类型)。数据集分为训练集、测试集和验证集,分别包含20864、4636和2318个示例,总大小为6100160字节。
提供机构:
xusenlin
原始信息汇总
数据集概述
数据集名称
人民日报命名实体识别数据集
数据集特征
- text (字符串类型)
- entities (列表类型)
- id (整数类型)
- entity (字符串类型)
- start_offset (整数类型)
- end_offset (整数类型)
- label (字符串类型)
数据集划分
- train
- 数据量: 4564472 字节
- 样本数: 20864
- test
- 数据量: 1025142 字节
- 样本数: 4636
- validation
- 数据量: 510546 字节
- 样本数: 2318
数据集大小
- 下载大小: 3891711 字节
- 数据集总大小: 6100160 字节



