oualidlamrini/dataset_ner
收藏Hugging Face2024-06-25 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/oualidlamrini/dataset_ner
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含用于命名实体识别任务的文本数据,特征包括tokens和ner_tags。ner_tags是一个序列,包含多个类标签,如O, B-nom, I-nom等,用于标识文本中的不同实体类型。数据集被分割为训练集、验证集和测试集,分别包含173、35和24个示例。
该数据集包含用于命名实体识别任务的文本数据,特征包括tokens和ner_tags。ner_tags是一个序列,包含多个类标签,如O, B-nom, I-nom等,用于标识文本中的不同实体类型。数据集被分割为训练集、验证集和测试集,分别包含173、35和24个示例。
提供机构:
oualidlamrini
原始信息汇总
数据集概述
特征
- tokens: 字符串序列
- ner_tags: 命名实体识别标签序列
- 标签类别:
0: O (非实体)1: B-nom (姓氏开始)2: I-nom (姓氏内部)3: B-prenom (名字开始)4: I-prenom (名字内部)5: B-sexe (性别开始)6: I-sexe (性别内部)7: B-lieu_naissance (出生地开始)8: I-lieu_naissance (出生地内部)9: B-date_naissance (出生日期开始)10: I-date_naissance (出生日期内部)11: B-nom_d_usage (使用名开始)12: I-nom_d_usage (使用名内部)13: B-adresse (地址开始)14: I-adresse (地址内部)
- 标签类别:
数据集划分
- train: 训练集
- 样本数量: 173
- 字节数: 145188
- validation: 验证集
- 样本数量: 35
- 字节数: 28368
- test: 测试集
- 样本数量: 24
- 字节数: 18592
数据集大小
- 下载大小: 55775 字节
- 数据集总大小: 192148 字节
配置
- default: 默认配置
- 数据文件路径:
- 训练集:
data/train-* - 验证集:
data/validation-* - 测试集:
data/test-*
- 训练集:
- 数据文件路径:



