Gizachew/amh-ner
收藏Hugging Face2024-04-11 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Gizachew/amh-ner
下载链接
链接失效反馈官方服务:
资源简介:
该数据集用于命名实体识别(NER)任务,包含id、tokens和ner_tags三个字段。ner_tags字段是一个序列字段,包含了命名实体识别的标签类别,如人名(PER)、组织名(ORG)、地点(LOC)和日期(DATE)等。数据集分为训练集、验证集和测试集,分别包含1750、250和500个样本。
该数据集用于命名实体识别(NER)任务,包含id、tokens和ner_tags三个字段。ner_tags字段是一个序列字段,包含了命名实体识别的标签类别,如人名(PER)、组织名(ORG)、地点(LOC)和日期(DATE)等。数据集分为训练集、验证集和测试集,分别包含1750、250和500个样本。
提供机构:
Gizachew
原始信息汇总
数据集信息
特征
- id: 数据类型为字符串。
- tokens: 序列类型,数据类型为字符串。
- ner_tags: 序列类型,包含类别标签,具体标签如下:
- 0: O
- 1: B-PER
- 2: I-PER
- 3: B-ORG
- 4: I-ORG
- 5: B-LOC
- 6: I-LOC
- 7: B-DATE
- 8: I-DATE
数据分割
- train: 包含1750个样本,占用639427字节。
- validation: 包含250个样本,占用92479字节。
- test: 包含500个样本,占用184216字节。
数据集大小
- 下载大小: 269989字节
- 数据集大小: 916122字节
配置
- default: 数据文件路径如下:
- train: data/train-*
- validation: data/validation-*
- test: data/test-*



