livinNector/ner_naamapadam
收藏Hugging Face2023-04-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/livinNector/ner_naamapadam
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: tokens
sequence: string
- name: ner_tags
sequence:
class_label:
names:
'0': O
'1': B-PER
'2': I-PER
'3': B-ORG
'4': I-ORG
'5': B-LOC
'6': I-LOC
splits:
- name: train
num_bytes: 186464659
num_examples: 497882
- name: test
num_bytes: 319747
num_examples: 758
- name: validation
num_bytes: 1046343
num_examples: 2795
download_size: 48623255
dataset_size: 187830749
---
# Dataset Card for "ner_naamapadam"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
### 数据集信息
#### 特征字段
1. **词元(tokens)**:字符串序列类型
2. **命名实体识别标签(ner_tags)**:序列类型,其类别标签映射关系如下:
- '0':O(非实体标记)
- '1':B-PER(人物实体起始标记)
- '2':I-PER(人物实体内部标记)
- '3':B-ORG(组织实体起始标记)
- '4':I-ORG(组织实体内部标记)
- '5':B-LOC(位置实体起始标记)
- '6':I-LOC(位置实体内部标记)
#### 数据集划分
- 训练集(train):字节占用量为186464659,样本总数为497882
- 测试集(test):字节占用量为319747,样本总数为758
- 验证集(validation):字节占用量为1046343,样本总数为2795
- 下载总大小:48623255
- 数据集总存储大小:187830749
---
# 「ner_naamapadam」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
livinNector
原始信息汇总
数据集概述
数据集名称
ner_naamapadam
数据特征
- tokens: 字符串序列
- ner_tags: 序列标签,包含以下类别:
- 0: O
- 1: B-PER
- 2: I-PER
- 3: B-ORG
- 4: I-ORG
- 5: B-LOC
- 6: I-LOC
数据集划分
- train:
- 大小: 186464659 字节
- 示例数量: 497882
- test:
- 大小: 319747 字节
- 示例数量: 758
- validation:
- 大小: 1046343 字节
- 示例数量: 2795
数据集大小
- 下载大小: 48623255 字节
- 数据集总大小: 187830749 字节



