doushabao4766/resume_zh_ner_knowledge_V3_wc
收藏Hugging Face2023-05-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/doushabao4766/resume_zh_ner_knowledge_V3_wc
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: int64
- name: tokens
sequence: string
- name: ner_tags
sequence: int64
- name: knowledge
dtype: string
- name: token_words
sequence:
sequence: string
- name: knowledge_words
sequence:
sequence: string
splits:
- name: train
num_bytes: 36919276
num_examples: 3821
- name: validation
num_bytes: 4426698
num_examples: 463
- name: test
num_bytes: 4274705
num_examples: 477
download_size: 0
dataset_size: 45620679
---
# Dataset Card for "resume_zh_ner_knowledge_V3_wc"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
数据集信息:
特征:
- 字段名:id,数据类型:int64
- 字段名:tokens,类型:Token(Token)序列,数据类型:字符串序列
- 字段名:ner_tags,类型:命名实体识别(Named Entity Recognition, NER)标签序列,数据类型:int64
- 字段名:knowledge,数据类型:字符串
- 字段名:token_words,类型:双层字符串序列(即序列的序列)
- 字段名:knowledge_words,类型:双层字符串序列(即序列的序列)
数据集划分:
- 名称:训练集(train),字节大小:36919276,样本数量:3821
- 名称:验证集(validation),字节大小:4426698,样本数量:463
- 名称:测试集(test),字节大小:4274705,样本数量:477
下载大小:0
数据集总大小:45620679
---
# 「resume_zh_ner_knowledge_V3_wc」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
doushabao4766
原始信息汇总
数据集概述
数据集名称
resume_zh_ner_knowledge_V3_wc
数据集特征
- id: 整数类型 (int64)
- tokens: 字符串序列
- ner_tags: 整数序列 (int64)
- knowledge: 字符串类型
- token_words: 字符串序列的序列
- knowledge_words: 字符串序列的序列
数据集分割
- 训练集 (train): 3821个样本,占用36919276字节
- 验证集 (validation): 463个样本,占用4426698字节
- 测试集 (test): 477个样本,占用4274705字节
数据集大小
- 下载大小: 0字节
- 数据集总大小: 45620679字节



