risqaliyevds/uzbek_ner
收藏Hugging Face2024-06-06 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/risqaliyevds/uzbek_ner
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是为乌兹别克语文本的命名实体识别(NER)而创建的。数据集包括来自各种类别的命名实体,如人名、地名、组织名、日期等。数据以JSON格式提供,并遵循特定的准备指南。
该数据集是为乌兹别克语文本的命名实体识别(NER)而创建的。数据集包括来自各种类别的命名实体,如人名、地名、组织名、日期等。数据以JSON格式提供,并遵循特定的准备指南。
提供机构:
risqaliyevds
原始信息汇总
Uzbek NER Dataset 概述
数据集描述
- 用途: 用于乌兹别克语文本的命名实体识别(NER)。
- 实体类别: 包括人名、地名、组织名、日期、货币金额、百分比值、数量、时间表达、产品名、事件名、艺术作品标题、语言名、基数、序数、民族或宗教/政治团体、设施名、法律或法规、国家、城市、州等。
数据结构
- 格式: JSON
- 结构: 包含多个实体类别,每个类别下有相应的实体名称列表。
数据准备指南
- 实体提取: 从文本中提取了大约80%-90%的命名实体。
- 实体形式: 实体以原始形式提供,无额外注释或翻译。
示例
- 实体类别示例: 如地名、组织名、人名等,每个类别下提供具体示例。
下载方式
- 代码: 使用
from datasets import load_dataset并指定数据集路径"risqaliyevds/uzbek_ner"进行下载。
许可证
- 类型: MIT
- 使用: 免费开放源代码,供所有用户自由使用。



