Minggz/Vi-Ner
收藏Hugging Face2024-01-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Minggz/Vi-Ner
下载链接
链接失效反馈官方服务:
资源简介:
Vi-Ner数据集是一个用于命名实体识别(NER)任务的数据集,主要针对越南语文本。数据集包含多种实体标签,如日期时间、地点、组织和个人等。数据被分为训练集、验证集和测试集,分别包含19255、2407和2407条数据。数据集适用于法律领域的文本分析任务。
Vi-Ner数据集是一个用于命名实体识别(NER)任务的数据集,主要针对越南语文本。数据集包含多种实体标签,如日期时间、地点、组织和个人等。数据被分为训练集、验证集和测试集,分别包含19255、2407和2407条数据。数据集适用于法律领域的文本分析任务。
提供机构:
Minggz
原始信息汇总
Vi-Ner 数据集
数据集描述
- 任务类别: 词性标注
- 语言: 越南语
- 标签: 分类标签(整数)
- 完整标签集及其索引: python {B-DATETIME: 0, B-LOCATION: 1, B-ORGANIZATION: 2, B-PERSON: 3, I-DATETIME: 4, I-LOCATION: 5, I-ORGANIZATION: 6, I-PERSON: 7, O: 8}
数据划分
| 名称 | 训练集 | 验证集 | 测试集 |
|---|---|---|---|
| Vi-Ner | 19255 | 2407 | 2407 |
示例
- 训练集示例: python { tokens: [NSƯT, Hồng, Liên, (trái), đến, chúc, mừng, Thu, Trang..], ner_tags: [B-PERSON, I-PERSON, I-PERSON, O, O, O, O, B-PERSON, I-PERSON], ner_idx: [3, 7, 7, 8, 8, 8, 8, 3, 7] }



