five

reginaboateng/cleaned_ebmnlp_pico

收藏
Hugging Face2023-03-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/reginaboateng/cleaned_ebmnlp_pico
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: tokens sequence: string - name: chunk_tags sequence: string - name: pos_tags sequence: string - name: ner_tags sequence: class_label: names: '0': O '1': I-INT '2': I-OUT '3': I-PAR splits: - name: train num_bytes: 29122187 num_examples: 26016 - name: validation num_bytes: 1482730 num_examples: 2064 download_size: 3415345 dataset_size: 30604917 --- # Dataset Card for "cleaned_ebmnlp_pico" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

--- 数据集信息: 特征字段: - 名称: tokens(标记(Token)序列) 序列类型: 字符串 - 名称: chunk_tags(组块标记标签) 序列类型: 字符串 - 名称: pos_tags(词性标注(Part-of-Speech,简称POS)标签) 序列类型: 字符串 - 名称: ner_tags(命名实体识别(Named Entity Recognition,简称NER)标签) 序列类型: 类别标签: 标签名称: '0': O(非实体标记) '1': I-INT(干预措施实体内部标记) '2': I-OUT(研究结局实体内部标记) '3': I-PAR(研究对象实体内部标记) 数据集拆分: - 名称: 训练集 字节数: 29122187 样本数量: 26016 - 名称: 验证集 字节数: 1482730 样本数量: 2064 下载大小: 3415345 总数据集大小: 30604917 --- # 「cleaned_ebmnlp_pico」数据集卡片 [更多信息待补充](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
reginaboateng
原始信息汇总

数据集概述

数据集名称

cleaned_ebmnlp_pico

数据集特征

  • tokens: 字符串序列
  • chunk_tags: 字符串序列
  • pos_tags: 字符串序列
  • ner_tags: 字符串序列,类别标签包括:
    • 0: O
    • 1: I-INT
    • 2: I-OUT
    • 3: I-PAR

数据集分割

  • train:
    • 字节数: 29122187
    • 示例数: 26016
  • validation:
    • 字节数: 1482730
    • 示例数: 2064

数据集大小

  • 下载大小: 3415345
  • 数据集总大小: 30604917
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作