five

Minggz/Vi-Ner

收藏
Hugging Face2024-01-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Minggz/Vi-Ner
下载链接
链接失效反馈
官方服务:
资源简介:
Vi-Ner数据集是一个用于命名实体识别(NER)任务的数据集,主要针对越南语文本。数据集包含多种实体标签,如日期时间、地点、组织和个人等。数据被分为训练集、验证集和测试集,分别包含19255、2407和2407条数据。数据集适用于法律领域的文本分析任务。

Vi-Ner数据集是一个用于命名实体识别(NER)任务的数据集,主要针对越南语文本。数据集包含多种实体标签,如日期时间、地点、组织和个人等。数据被分为训练集、验证集和测试集,分别包含19255、2407和2407条数据。数据集适用于法律领域的文本分析任务。
提供机构:
Minggz
原始信息汇总

Vi-Ner 数据集

数据集描述

  • 任务类别: 词性标注
  • 语言: 越南语
  • 标签: 分类标签(整数)
    • 完整标签集及其索引: python {B-DATETIME: 0, B-LOCATION: 1, B-ORGANIZATION: 2, B-PERSON: 3, I-DATETIME: 4, I-LOCATION: 5, I-ORGANIZATION: 6, I-PERSON: 7, O: 8}

数据划分

名称 训练集 验证集 测试集
Vi-Ner 19255 2407 2407

示例

  • 训练集示例: python { tokens: [NSƯT, Hồng, Liên, (trái), đến, chúc, mừng, Thu, Trang..], ner_tags: [B-PERSON, I-PERSON, I-PERSON, O, O, O, O, B-PERSON, I-PERSON], ner_idx: [3, 7, 7, 8, 8, 8, 8, 3, 7] }
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作