aslon1213/ner_data_with_string_labels
收藏Hugging Face2024-06-15 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/aslon1213/ner_data_with_string_labels
下载链接
链接失效反馈官方服务:
资源简介:
该数据集主要用于命名实体识别(NER)任务,包含文本数据及其对应的命名实体标签。数据集的特征包括文本、命名实体标签、标记和标记级别的命名实体标签。命名实体标签包含实体的结束位置、标签、开始位置和实体文本。数据集仅包含一个训练集,共有966个样本,文件大小为5336834字节。
This dataset is primarily used for Named Entity Recognition (NER) tasks, containing text data and corresponding named entity tags. The features of the dataset include text, named entity tags, tokens, and token-level named entity tags. The named entity tags include the end position, label, start position, and text of the entity. The dataset contains only a training set with 966 examples and a file size of 5336834 bytes.
提供机构:
aslon1213
原始信息汇总
数据集概述
数据集特征
- text:文本数据,数据类型为字符串。
- ner_tags:命名实体标签,包含以下子特征:
- end:结束位置,数据类型为整数。
- label:标签名称,数据类型为字符串。
- start:开始位置,数据类型为整数。
- text:文本内容,数据类型为字符串。
- tokens:分词结果,数据类型为字符串序列。
- ner_tags_tokens:分词后的命名实体标签,数据类型为字符串序列。
数据集划分
- train:训练集,包含966个样本,总大小为5336834字节。
数据集大小
- 下载大小:1217165字节
- 数据集总大小:5336834字节
数据文件配置
- config_name: default
- data_files:
- split: train
- path: data/train-*



