mirfan899/hindi-ner
收藏Hugging Face2023-10-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mirfan899/hindi-ner
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为hindi-ner,包含训练集、验证集和测试集。数据集的特征包括id、tokens和ner_tags,其中ner_tags是一个序列,包含多个类别的标签,如LOCATION、BRAND、TITLE_OBJECT等。数据集的总大小为42556712字节,下载大小为6072695字节。
提供机构:
mirfan899
原始信息汇总
数据集概述
配置
- 默认配置:
- 训练集:路径为
data/train-* - 验证集:路径为
data/validation-* - 测试集:路径为
data/test-*
- 训练集:路径为
数据特征
- id:数据类型为字符串
- tokens:序列类型,数据类型为字符串
- ner_tags:序列类型,包含以下类别标签:
- 0: LOCATION
- 1: BRAND
- 2: TITLE_OBJECT
- 3: PERSON
- 4: DESIGNATION
- 5: ORGANIZATION
- 6: ABBREVIATION
- 7: TIME
- 8: NUMBER
- 9: MEASURE
- 10: TERMS
- 11: O
数据分割
- 训练集:
- 字节数:22988092
- 样本数:18376
- 验证集:
- 字节数:9784310
- 样本数:7876
- 测试集:
- 字节数:9784310
- 样本数:7876
数据集大小
- 下载大小:6072695 字节
- 数据集大小:42556712 字节



