mirfan899/punjabi-ner
收藏Hugging Face2023-09-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mirfan899/punjabi-ner
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含训练集、验证集和测试集,每个集都有对应的文件路径。数据集的特征包括id、tokens和ner_tags,其中ner_tags是一个序列,包含了命名实体识别的标签,如人名(PER)、组织名(ORG)和地名(LOC)等。数据集的统计信息包括每个集的大小(字节数)和样本数,以及总下载大小和数据集总大小。
提供机构:
mirfan899
原始信息汇总
数据集概述
许可证
- 类型:其他
配置
- 默认配置
- 数据文件路径:
- 训练集:
data/train-* - 验证集:
data/validation-* - 测试集:
data/test-*
- 训练集:
- 数据文件路径:
数据集信息
特征
id:字符串类型tokens:字符串序列ner_tags:序列类型- 类别标签:
0:O1:I-PER2:I-ORG3:I-LOC4:B-PER5:B-ORG6:B-LOC
- 类别标签:
数据分割
- 训练集
- 字节数:4548073
- 样本数:12903
- 验证集
- 字节数:1941857
- 样本数:5530
- 测试集
- 字节数:1941857
- 样本数:5530
数据大小
- 下载大小:1914615 字节
- 数据集大小:8431787 字节



