Maiia/skillspan_job_ner_without_capitalization
收藏Hugging Face2023-02-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Maiia/skillspan_job_ner_without_capitalization
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: input_ids
sequence: int64
- name: labels
sequence:
class_label:
names:
'0': B-Skill I-Knowledge
'1': I-Skill B-Knowledge
'2': B-Knowledge
'3': I-Skill I-Knowledge
'4': I-Skill
'5': B-Skill
'6': I-Knowledge
'7': O
'8': -100
splits:
- name: train
num_bytes: 7211448
num_examples: 8005
- name: test
num_bytes: 2374184
num_examples: 3565
download_size: 0
dataset_size: 9585632
---
# Dataset Card for "skillspan_job_ner_without_capitalization"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
特征字段:
- 字段名:input_ids(输入标识符),类型为int64序列
- 字段名:labels(标签),其序列为类别标签类型,类别名称映射如下:
'0': B-技能 I-知识(B-Skill I-Knowledge)
'1': I-技能 B-知识(I-Skill B-Knowledge)
'2': B-知识(B-Knowledge)
'3': I-技能 I-知识(I-Skill I-Knowledge)
'4': I-技能(I-Skill)
'5': B-技能(B-Skill)
'6': I-知识(I-Knowledge)
'7': 其他非实体标记(O)
'8': -100(损失掩码标记)
数据集划分:
- 划分名称:训练集(train),占用字节数:7211448,样本总量:8005
- 划分名称:测试集(test),占用字节数:2374184,样本总量:3565
下载大小:0
数据集总大小:9585632
# 「skillspan_job_ner_without_capitalization」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Maiia
原始信息汇总
数据集概述
数据集名称
- 名称: skillspan_job_ner_without_capitalization
数据集特征
- 特征列表:
- input_ids: 类型为
int64的序列数据。 - labels: 类型为序列,包含以下类别标签:
- 0: B-Skill I-Knowledge
- 1: I-Skill B-Knowledge
- 2: B-Knowledge
- 3: I-Skill I-Knowledge
- 4: I-Skill
- 5: B-Skill
- 6: I-Knowledge
- 7: O
- 8: -100
- input_ids: 类型为
数据集分割
- 训练集:
- 大小: 7211448字节
- 样本数: 8005
- 测试集:
- 大小: 2374184字节
- 样本数: 3565
数据集大小
- 总大小: 9585632字节
- 下载大小: 0字节



