five

amitness/mlrs-pos-mt

收藏
Hugging Face2023-09-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/amitness/mlrs-pos-mt
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: pos_tags sequence: class_label: names: '0': ADJ '1': ADV '2': COMP '3': CONJ_CORD '4': CONJ_SUB '5': DEF '6': FOC '7': FUT '8': GEN '9': GEN_DEF '10': GEN_PRON '11': HEMM '12': INT '13': KIEN '14': LIL '15': LIL_DEF '16': LIL_PRON '17': NEG '18': NOUN '19': NOUN_PROP '20': NUM_CRD '21': NUM_FRC '22': NUM_ORD '23': NUM_WHD '24': PART_ACT '25': PART_PASS '26': PREP '27': PREP_DEF '28': PREP_PRON '29': PROG '30': PRON_DEM '31': PRON_DEM_DEF '32': PRON_INDEF '33': PRON_INT '34': PRON_PERS '35': PRON_PERS_NEG '36': PRON_REC '37': PRON_REF '38': QUAN '39': VERB '40': VERB_PSEU '41': X_ABV '42': X_BOR '43': X_DIG '44': X_ENG '45': X_FOR '46': X_PUN - name: tokens sequence: string splits: - name: train num_bytes: 1443609 num_examples: 4935 - name: validation num_bytes: 234214 num_examples: 616 - name: test num_bytes: 212745 num_examples: 616 download_size: 0 dataset_size: 1890568 --- # Dataset Card for "mlrs-pos-mt" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
amitness
原始信息汇总

数据集概述

特征信息

  • pos_tags:
    • 类型: 序列
    • 类别标签名称:
      • 0: ADJ
      • 1: ADV
      • 2: COMP
      • 3: CONJ_CORD
      • 4: CONJ_SUB
      • 5: DEF
      • 6: FOC
      • 7: FUT
      • 8: GEN
      • 9: GEN_DEF
      • 10: GEN_PRON
      • 11: HEMM
      • 12: INT
      • 13: KIEN
      • 14: LIL
      • 15: LIL_DEF
      • 16: LIL_PRON
      • 17: NEG
      • 18: NOUN
      • 19: NOUN_PROP
      • 20: NUM_CRD
      • 21: NUM_FRC
      • 22: NUM_ORD
      • 23: NUM_WHD
      • 24: PART_ACT
      • 25: PART_PASS
      • 26: PREP
      • 27: PREP_DEF
      • 28: PREP_PRON
      • 29: PROG
      • 30: PRON_DEM
      • 31: PRON_DEM_DEF
      • 32: PRON_INDEF
      • 33: PRON_INT
      • 34: PRON_PERS
      • 35: PRON_PERS_NEG
      • 36: PRON_REC
      • 37: PRON_REF
      • 38: QUAN
      • 39: VERB
      • 40: VERB_PSEU
      • 41: X_ABV
      • 42: X_BOR
      • 43: X_DIG
      • 44: X_ENG
      • 45: X_FOR
      • 46: X_PUN
  • tokens:
    • 类型: 序列
    • 数据类型: 字符串

数据分割

  • train:
    • 字节数: 1443609
    • 样本数: 4935
  • validation:
    • 字节数: 234214
    • 样本数: 616
  • test:
    • 字节数: 212745
    • 样本数: 616

数据集大小

  • 下载大小: 0
  • 数据集大小: 1890568
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作