five

gwlms/germeval2014

收藏
Hugging Face2023-07-31 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/gwlms/germeval2014
下载链接
链接失效反馈
官方服务:
资源简介:
--- viewer: false license: cc-by-4.0 dataset_info: features: - name: tokens sequence: string - name: ner_tags sequence: class_label: names: '0': O '1': B-LOC '2': I-LOC '3': B-LOCderiv '4': I-LOCderiv '5': B-LOCpart '6': I-LOCpart '7': B-ORG '8': I-ORG '9': B-ORGderiv '10': I-ORGderiv '11': B-ORGpart '12': I-ORGpart '13': B-OTH '14': I-OTH '15': B-OTHderiv '16': I-OTHderiv '17': B-OTHpart '18': I-OTHpart '19': B-PER '20': I-PER '21': B-PERderiv '22': I-PERderiv '23': B-PERpart '24': I-PERpart - name: ner_t5_output dtype: string - name: ner_own_output dtype: string splits: - name: train num_bytes: 9450958 num_examples: 24000 - name: validation num_bytes: 866649 num_examples: 2200 - name: test num_bytes: 2011187 num_examples: 5100 download_size: 4279522 dataset_size: 12328794 ---
提供机构:
gwlms
原始信息汇总

数据集概述

数据集特征

  • tokens: 字符串序列
  • ner_tags: 序列标签,包含以下类别:
    • 0: O
    • 1: B-LOC
    • 2: I-LOC
    • 3: B-LOCderiv
    • 4: I-LOCderiv
    • 5: B-LOCpart
    • 6: I-LOCpart
    • 7: B-ORG
    • 8: I-ORG
    • 9: B-ORGderiv
    • 10: I-ORGderiv
    • 11: B-ORGpart
    • 12: I-ORGpart
    • 13: B-OTH
    • 14: I-OTH
    • 15: B-OTHderiv
    • 16: I-OTHderiv
    • 17: B-OTHpart
    • 18: I-OTHpart
    • 19: B-PER
    • 20: I-PER
    • 21: B-PERderiv
    • 22: I-PERderiv
    • 23: B-PERpart
    • 24: I-PERpart
  • ner_t5_output: 字符串类型
  • ner_own_output: 字符串类型

数据集分割

  • train: 24000个样本,占用9450958字节
  • validation: 2200个样本,占用866649字节
  • test: 5100个样本,占用2011187字节

数据集大小

  • 下载大小: 4279522字节
  • 数据集总大小: 12328794字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作