five

risqaliyevds/uzbek_ner

收藏
Hugging Face2024-06-06 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/risqaliyevds/uzbek_ner
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是为乌兹别克语文本的命名实体识别(NER)而创建的。数据集包括来自各种类别的命名实体,如人名、地名、组织名、日期等。数据以JSON格式提供,并遵循特定的准备指南。

该数据集是为乌兹别克语文本的命名实体识别(NER)而创建的。数据集包括来自各种类别的命名实体,如人名、地名、组织名、日期等。数据以JSON格式提供,并遵循特定的准备指南。
提供机构:
risqaliyevds
原始信息汇总

Uzbek NER Dataset 概述

数据集描述

  • 用途: 用于乌兹别克语文本的命名实体识别(NER)。
  • 实体类别: 包括人名、地名、组织名、日期、货币金额、百分比值、数量、时间表达、产品名、事件名、艺术作品标题、语言名、基数、序数、民族或宗教/政治团体、设施名、法律或法规、国家、城市、州等。

数据结构

  • 格式: JSON
  • 结构: 包含多个实体类别,每个类别下有相应的实体名称列表。

数据准备指南

  • 实体提取: 从文本中提取了大约80%-90%的命名实体。
  • 实体形式: 实体以原始形式提供,无额外注释或翻译。

示例

  • 实体类别示例: 如地名、组织名、人名等,每个类别下提供具体示例。

下载方式

  • 代码: 使用 from datasets import load_dataset 并指定数据集路径 "risqaliyevds/uzbek_ner" 进行下载。

许可证

  • 类型: MIT
  • 使用: 免费开放源代码,供所有用户自由使用。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作