CLUENER2020 中文细粒度命名实体识别
收藏阿里云天池2026-06-09 更新2024-03-07 收录
下载链接:
https://tianchi.aliyun.com/dataset/144362
下载链接
链接失效反馈官方服务:
资源简介:
本数据是在清华大学开源的文本分类数据集THUCTC基础上,选出部分数据进行细粒度命名实体标注,原数据来源于Sina News RSS.
This dataset is built upon the open-source text classification dataset THUCTC released by Tsinghua University. The original data of THUCTC was sourced from Sina News RSS, and a subset of this data was selected for fine-grained named entity annotation.
提供机构:
阿里云天池
创建时间:
2023-01-11
搜集汇总
数据集介绍

背景与挑战
背景概述
CLUENER2020数据集基于清华大学THUCTC文本分类数据集的子集进行细粒度命名实体标注,包含地址、书名、公司等10个类别。该数据集提供了训练集和验证集,并详细说明了实体标注规则、数据分布及字段格式。
以上内容由遇见数据集搜集并总结生成



