five

JoelMba/PV_dataset_disorders

收藏
Hugging Face2026-04-15 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/JoelMba/PV_dataset_disorders
下载链接
链接失效反馈
官方服务:
资源简介:
--- configs: - config_name: default data_files: - split: train path: data/train-* - split: validation path: data/validation-* - split: test path: data/test-* dataset_info: features: - name: id dtype: string - name: tokens sequence: string - name: ner_tags sequence: class_label: names: '0': B-Disorders '1': I-Disorders '2': O - name: ner_tag_labels sequence: string splits: - name: train num_bytes: 1548777.7145123465 num_examples: 2658 - name: validation num_bytes: 1557799.2387096775 num_examples: 2727 - name: test num_bytes: 1631790.6702479338 num_examples: 2842 download_size: 799095 dataset_size: 4738367.623469958 --- # Dataset Card for "PV_dataset_disorders" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

### 配置项 - 配置名称:默认(default) 数据文件列表: - 训练集(train):数据路径为 `data/train-*` - 验证集(validation):数据路径为 `data/validation-*` - 测试集(test):数据路径为 `data/test-*` ### 数据集信息 #### 特征字段 1. 字段名:`id`,数据类型:字符串 2. 字段名:词元(Token),类型:字符串序列 3. 字段名:命名实体识别标签(ner_tags),序列类型为类别标签,其标签映射如下: - `'0'`:B-疾病实体(B-Disorders) - `'1'`:I-疾病实体(I-Disorders) - `'2'`:非实体(O) 4. 字段名:命名实体识别标签集(ner_tag_labels),类型:字符串序列 #### 数据划分 - 训练集(train):总字节数 1548777.7145123465,样本数 2658 - 验证集(validation):总字节数 1557799.2387096775,样本数 2727 - 测试集(test):总字节数 1631790.6702479338,样本数 2842 下载总大小:799095 数据集总大小:4738367.623469958 --- # “PV_dataset_disorders”数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
JoelMba
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作