argilla/spacy_sm_wnut17
收藏Hugging Face2023-02-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/argilla/spacy_sm_wnut17
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含tokens和ner_tags两个主要特性,其中ner_tags用于命名实体识别,包含多种实体标签如CARDINAL、DATE、EVENT等。数据集分为训练集和测试集,分别包含119和30个例子。数据集的下载大小为19265字节,总大小为49531.0字节。
该数据集包含tokens和ner_tags两个主要特性,其中ner_tags用于命名实体识别,包含多种实体标签如CARDINAL、DATE、EVENT等。数据集分为训练集和测试集,分别包含119和30个例子。数据集的下载大小为19265字节,总大小为49531.0字节。
提供机构:
argilla
原始信息汇总
数据集概述
数据集特征
- tokens: 字符串序列
- ner_tags: 序列标签,包含以下类别:
- 0: O
- 1: B-CARDINAL
- 2: I-CARDINAL
- 3: B-DATE
- 4: I-DATE
- 5: B-EVENT
- 6: I-EVENT
- 7: B-FAC
- 8: I-FAC
- 9: B-GPE
- 10: I-GPE
- 11: B-LAW
- 12: I-LAW
- 13: B-LOC
- 14: I-LOC
- 15: B-MONEY
- 16: I-MONEY
- 17: B-NORP
- 18: I-NORP
- 19: B-ORDINAL
- 20: I-ORDINAL
- 21: B-ORG
- 22: I-ORG
- 23: B-PERCENT
- 24: I-PERCENT
- 25: B-PERSON
- 26: I-PERSON
- 27: B-QUANTITY
- 28: I-QUANTITY
- 29: B-TIME
- 30: I-TIME
- 31: B-WORK_OF_ART
- 32: I-WORK_OF_ART
数据集分割
- train:
- 数据大小: 39558.31543624161 字节
- 样本数量: 119
- test:
- 数据大小: 9972.68456375839 字节
- 样本数量: 30
数据集大小
- 下载大小: 19265 字节
- 数据集总大小: 49531.0 字节



