rushi-shaharao/NER_data
收藏Hugging Face2024-07-18 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/rushi-shaharao/NER_data
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了文本及其相关属性,如标签、命名实体识别标签等。它被划分为训练集和测试集,可用于自然语言处理任务,如文本分类和命名实体识别。
The dataset includes text and its related attributes, such as tags, named entity recognition tags, etc. It is split into training and test sets and can be used for natural language processing tasks such as text classification and named entity recognition.
提供机构:
rushi-shaharao
原始信息汇总
数据集概述
数据集信息
特征
- id: 数据类型为字符串。
- tags: 数据类型为字符串。
- text: 数据类型为字符串。
- dataset_num: 数据类型为整数(int64)。
- tokens: 数据类型为字符串序列。
- ner_tags: 数据类型为浮点数序列(float64)。
数据分割
- train: 包含16068个样本,占用7176115.825359685字节。
- test: 包含4019个样本,占用1794922.1746403147字节。
数据集大小
- 下载大小: 2881056字节。
- 数据集总大小: 8971038.0字节。
配置
- default:
- train: 数据文件路径为
data/train-*。 - test: 数据文件路径为
data/test-*。
- train: 数据文件路径为



