literature命名实体识别数据集
收藏魔搭社区2026-04-21 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/iic/literature_ner
下载链接
链接失效反馈官方服务:
资源简介:
# Literature-NER命名实体识别数据集
## 数据集概述
Literature-NER数据集是面向文学领域的中文命名实体识别数据集。
### 数据集简介
本数据集包括测试集(2837),实体类型包括书名、地址、数量、组织、任务、事物、时间。
### 数据集的格式和结构
数据格式采用conll标准,数据分为两列,第一列是输入句中的词划分,第二列是每个词对应的命名实体类型标签。一个具体case的例子如下:
```
纸 B_Thing
灰 I_Thing
飞 I_Thing
作 O
白 B_Thing
蝴 I_Thing
蝶 I_Thing
, O
泪 B_Thing
血 I_Thing
染 O
成 O
红 B_Thing
杜 I_Thing
鹃 I_Thing
” O
。 O
```
## 数据集版权信息
Creative Commons Attribution 4.0 International。
## 引用方式
```bib
@inproceedings{dnerre,
author = {Jingjing Xu and Ji Wen and Xu Sun and Qi Su},
title = {A Discourse-Level Named Entity Recognition and Relation Extraction Dataset for Chinese Literature Text},
journal = {CoRR},
volume = {abs/1711.07010},
year = {2017},
url = http://arxiv.org/abs/1711.07010
}
```
# Literature-NER命名实体识别数据集
## 数据集概述
Literature-NER命名实体识别数据集是面向中文文学领域的专用命名实体识别数据集。
### 数据集简介
本数据集包含测试集(共2837条样本),涵盖的实体类型包括书名、地址、数量、组织、任务、事物、时间。
### 数据集的格式和结构
本数据集采用CoNLL标准格式进行组织,数据分为两列:第一列为输入语句的分词结果,第二列为对应每个分词的命名实体类型标签。具体示例如下:
纸 B_Thing
灰 I_Thing
飞 I_Thing
作 O
白 B_Thing
蝴 I_Thing
蝶 I_Thing
, O
泪 B_Thing
血 I_Thing
染 O
成 O
红 B_Thing
杜 I_Thing
鹃 I_Thing
” O
。 O
## 数据集版权信息
本数据集采用知识共享署名4.0国际许可协议(Creative Commons Attribution 4.0 International)进行授权。
## 引用方式
bib
@inproceedings{dnerre,
author = {Jingjing Xu and Ji Wen and Xu Sun and Qi Su},
title = {面向中文文学文本的语篇级命名实体识别与关系抽取数据集},
journal = {CoRR},
volume = {abs/1711.07010},
year = {2017},
url = http://arxiv.org/abs/1711.07010
}
提供机构:
maas
创建时间:
2022-10-25
搜集汇总
数据集介绍

背景与挑战
背景概述
Literature-NER是一个专注于中文文学领域的命名实体识别数据集,包含2837条测试数据,涵盖书名、地址、数量等七种实体类型。数据采用conll标准格式,以分词和对应实体标签的两列形式组织。
以上内容由遇见数据集搜集并总结生成



