five

Tippawan/SNOMED-CT-NER-V.2-k-fold-validation

收藏
Hugging Face2024-04-12 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Tippawan/SNOMED-CT-NER-V.2-k-fold-validation
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: text sequence: string - name: tag sequence: int64 splits: - name: train_1 num_bytes: 186541 num_examples: 1020 - name: train_2 num_bytes: 182025 num_examples: 1020 - name: train_3 num_bytes: 181323 num_examples: 1020 - name: train_4 num_bytes: 183654 num_examples: 1020 - name: train_5 num_bytes: 186057 num_examples: 1020 - name: validation_1 num_bytes: 43359 num_examples: 255 - name: validation_2 num_bytes: 47875 num_examples: 255 - name: validation_3 num_bytes: 48577 num_examples: 255 - name: validation_4 num_bytes: 46246 num_examples: 255 - name: validation_5 num_bytes: 43843 num_examples: 255 - name: test num_bytes: 30386 num_examples: 143 download_size: 333489 dataset_size: 1179886 configs: - config_name: default data_files: - split: train_1 path: data/train_1-* - split: train_2 path: data/train_2-* - split: train_3 path: data/train_3-* - split: train_4 path: data/train_4-* - split: train_5 path: data/train_5-* - split: validation_1 path: data/validation_1-* - split: validation_2 path: data/validation_2-* - split: validation_3 path: data/validation_3-* - split: validation_4 path: data/validation_4-* - split: validation_5 path: data/validation_5-* - split: test path: data/test-* ---
提供机构:
Tippawan
原始信息汇总

数据集概述

特征信息

  • text: 字符串序列
  • tag: 整数序列(int64)

数据分割

  • 训练集:

    • train_1: 1020个样本,186541字节
    • train_2: 1020个样本,182025字节
    • train_3: 1020个样本,181323字节
    • train_4: 1020个样本,183654字节
    • train_5: 1020个样本,186057字节
  • 验证集:

    • validation_1: 255个样本,43359字节
    • validation_2: 255个样本,47875字节
    • validation_3: 255个样本,48577字节
    • validation_4: 255个样本,46246字节
    • validation_5: 255个样本,43843字节
  • 测试集: 143个样本,30386字节

数据集大小

  • 下载大小: 333489字节
  • 数据集总大小: 1179886字节

配置信息

  • 默认配置文件包含所有分割的数据文件路径,路径格式为data/{split}-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作