doushabao4766/weibo_ner_knowledge_V3_wc
收藏Hugging Face2023-05-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/doushabao4766/weibo_ner_knowledge_V3_wc
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: string
- name: tokens
sequence: string
- name: ner_tags
sequence:
class_label:
names:
'0': B-GPE.NAM
'1': B-GPE.NOM
'2': B-LOC.NAM
'3': B-LOC.NOM
'4': B-ORG.NAM
'5': B-ORG.NOM
'6': B-PER.NAM
'7': B-PER.NOM
'8': I-GPE.NAM
'9': I-GPE.NOM
'10': I-LOC.NAM
'11': I-LOC.NOM
'12': I-ORG.NAM
'13': I-ORG.NOM
'14': I-PER.NAM
'15': I-PER.NOM
'16': O
- name: knowledge
dtype: string
- name: token_words
sequence:
sequence: string
- name: knowledge_words
sequence:
sequence: string
splits:
- name: train
num_bytes: 7027512
num_examples: 1350
- name: validation
num_bytes: 1116528
num_examples: 270
- name: test
num_bytes: 1107689
num_examples: 270
download_size: 2405285
dataset_size: 9251729
---
# Dataset Card for "weibo_ner_knowledge_V3_wc"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
doushabao4766
原始信息汇总
数据集概述
特征信息
- id: 数据类型为字符串。
- tokens: 序列类型,元素为字符串。
- ner_tags: 序列类型,元素为类别标签,具体标签如下:
- 0: B-GPE.NAM
- 1: B-GPE.NOM
- 2: B-LOC.NAM
- 3: B-LOC.NOM
- 4: B-ORG.NAM
- 5: B-ORG.NOM
- 6: B-PER.NAM
- 7: B-PER.NOM
- 8: I-GPE.NAM
- 9: I-GPE.NOM
- 10: I-LOC.NAM
- 11: I-LOC.NOM
- 12: I-ORG.NAM
- 13: I-ORG.NOM
- 14: I-PER.NAM
- 15: I-PER.NOM
- 16: O
- knowledge: 数据类型为字符串。
- token_words: 序列类型,元素为字符串。
- knowledge_words: 序列类型,元素为字符串。
数据分割
- train: 包含1350个样本,大小为7027512字节。
- validation: 包含270个样本,大小为1116528字节。
- test: 包含270个样本,大小为1107689字节。
数据集大小
- 下载大小: 2405285字节。
- 数据集总大小: 9251729字节。



