reginaboateng/cleaned_ebmnlp_pico
收藏Hugging Face2023-03-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/reginaboateng/cleaned_ebmnlp_pico
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: tokens
sequence: string
- name: chunk_tags
sequence: string
- name: pos_tags
sequence: string
- name: ner_tags
sequence:
class_label:
names:
'0': O
'1': I-INT
'2': I-OUT
'3': I-PAR
splits:
- name: train
num_bytes: 29122187
num_examples: 26016
- name: validation
num_bytes: 1482730
num_examples: 2064
download_size: 3415345
dataset_size: 30604917
---
# Dataset Card for "cleaned_ebmnlp_pico"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
数据集信息:
特征字段:
- 名称: tokens(标记(Token)序列)
序列类型: 字符串
- 名称: chunk_tags(组块标记标签)
序列类型: 字符串
- 名称: pos_tags(词性标注(Part-of-Speech,简称POS)标签)
序列类型: 字符串
- 名称: ner_tags(命名实体识别(Named Entity Recognition,简称NER)标签)
序列类型:
类别标签:
标签名称:
'0': O(非实体标记)
'1': I-INT(干预措施实体内部标记)
'2': I-OUT(研究结局实体内部标记)
'3': I-PAR(研究对象实体内部标记)
数据集拆分:
- 名称: 训练集
字节数: 29122187
样本数量: 26016
- 名称: 验证集
字节数: 1482730
样本数量: 2064
下载大小: 3415345
总数据集大小: 30604917
---
# 「cleaned_ebmnlp_pico」数据集卡片
[更多信息待补充](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
reginaboateng
原始信息汇总
数据集概述
数据集名称
cleaned_ebmnlp_pico
数据集特征
- tokens: 字符串序列
- chunk_tags: 字符串序列
- pos_tags: 字符串序列
- ner_tags: 字符串序列,类别标签包括:
- 0: O
- 1: I-INT
- 2: I-OUT
- 3: I-PAR
数据集分割
- train:
- 字节数: 29122187
- 示例数: 26016
- validation:
- 字节数: 1482730
- 示例数: 2064
数据集大小
- 下载大小: 3415345
- 数据集总大小: 30604917



