arbml/Disease_NER
收藏Hugging Face2024-07-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/arbml/Disease_NER
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征字段,如Word、Word i POS、Stopword、Word i Gazetteers、Word i Lexical marker、Word i definiteness和label。其中,label字段是一个分类标签,包含三个类别:I、O和B。数据集被分割为训练集,包含62506个样本,文件大小为4659233字节。下载大小为469581字节,数据集总大小为4659233字节。
The dataset includes multiple feature fields such as Word, Word i POS, Stopword, Word i Gazetteers, Word i Lexical marker, Word i definiteness, and label. The label field is a classification label with three categories: I, O, and B. The dataset is split into a training set containing 62,506 samples, with a file size of 4,659,233 bytes. The download size is 469,581 bytes, and the total dataset size is 4,659,233 bytes.
提供机构:
arbml
原始信息汇总
数据集概述
数据集特征
- Word: 类型为字符串。
- Word i POS: 类型为字符串。
- Stopword: 类型为字符串。
- Word i Gazetteers: 类型为字符串。
- Word i Lexical marker: 类型为字符串。
- Word i definiteness: 类型为字符串。
- label: 类型为分类标签,包含以下类别:
0: I1: O2: B
数据集划分
- train: 包含62506个样本,数据大小为4659233字节。
数据集大小
- 下载大小: 469581字节。
- 数据集大小: 4659233字节。
配置
- default:
- 数据文件:
- train: 路径为
data/train-*。
- train: 路径为
- 数据文件:



