five

gayanin/pubmed-mixed-noise

收藏
Hugging Face2024-01-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/gayanin/pubmed-mixed-noise
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: - config_name: prob-0.1 features: - name: refs dtype: string - name: trans dtype: string splits: - name: train num_bytes: 18701264 num_examples: 74724 - name: test num_bytes: 2396953 num_examples: 9341 - name: validation num_bytes: 2462407 num_examples: 9341 download_size: 13289466 dataset_size: 23560624 - config_name: prob-0.2 features: - name: refs dtype: string - name: trans dtype: string splits: - name: train num_bytes: 18589800 num_examples: 74724 - name: test num_bytes: 2382431 num_examples: 9341 - name: validation num_bytes: 2451124 num_examples: 9341 download_size: 13499759 dataset_size: 23423355 - config_name: prob-0.3 features: - name: refs dtype: string - name: trans dtype: string splits: - name: train num_bytes: 18473157 num_examples: 74724 - name: test num_bytes: 2368875 num_examples: 9341 - name: validation num_bytes: 2435716 num_examples: 9341 download_size: 13654916 dataset_size: 23277748 - config_name: prob-0.4 features: - name: refs dtype: string - name: trans dtype: string splits: - name: train num_bytes: 18365388 num_examples: 74724 - name: test num_bytes: 2353034 num_examples: 9341 - name: validation num_bytes: 2419352 num_examples: 9341 download_size: 13774850 dataset_size: 23137774 - config_name: prob-0.5 features: - name: refs dtype: string - name: trans dtype: string splits: - name: train num_bytes: 18252865 num_examples: 74724 - name: test num_bytes: 2340170 num_examples: 9341 - name: validation num_bytes: 2402882 num_examples: 9341 download_size: 13860568 dataset_size: 22995917 configs: - config_name: prob-0.1 data_files: - split: train path: prob-0.1/train-* - split: test path: prob-0.1/test-* - split: validation path: prob-0.1/validation-* - config_name: prob-0.2 data_files: - split: train path: prob-0.2/train-* - split: test path: prob-0.2/test-* - split: validation path: prob-0.2/validation-* - config_name: prob-0.3 data_files: - split: train path: prob-0.3/train-* - split: test path: prob-0.3/test-* - split: validation path: prob-0.3/validation-* - config_name: prob-0.4 data_files: - split: train path: prob-0.4/train-* - split: test path: prob-0.4/test-* - split: validation path: prob-0.4/validation-* - config_name: prob-0.5 data_files: - split: train path: prob-0.5/train-* - split: test path: prob-0.5/test-* - split: validation path: prob-0.5/validation-* ---
提供机构:
gayanin
原始信息汇总

数据集概述

数据集配置

prob-0.1

  • 特征:
    • refs: 字符串类型
    • trans: 字符串类型
  • 分割:
    • train: 18701264 字节, 74724 个样本
    • test: 2396953 字节, 9341 个样本
    • validation: 2462407 字节, 9341 个样本
  • 下载大小: 13289466 字节
  • 数据集大小: 23560624 字节

prob-0.2

  • 特征:
    • refs: 字符串类型
    • trans: 字符串类型
  • 分割:
    • train: 18589800 字节, 74724 个样本
    • test: 2382431 字节, 9341 个样本
    • validation: 2451124 字节, 9341 个样本
  • 下载大小: 13499759 字节
  • 数据集大小: 23423355 字节

prob-0.3

  • 特征:
    • refs: 字符串类型
    • trans: 字符串类型
  • 分割:
    • train: 18473157 字节, 74724 个样本
    • test: 2368875 字节, 9341 个样本
    • validation: 2435716 字节, 9341 个样本
  • 下载大小: 13654916 字节
  • 数据集大小: 23277748 字节

prob-0.4

  • 特征:
    • refs: 字符串类型
    • trans: 字符串类型
  • 分割:
    • train: 18365388 字节, 74724 个样本
    • test: 2353034 字节, 9341 个样本
    • validation: 2419352 字节, 9341 个样本
  • 下载大小: 13774850 字节
  • 数据集大小: 23137774 字节

prob-0.5

  • 特征:
    • refs: 字符串类型
    • trans: 字符串类型
  • 分割:
    • train: 18252865 字节, 74724 个样本
    • test: 2340170 字节, 9341 个样本
    • validation: 2402882 字节, 9341 个样本
  • 下载大小: 13860568 字节
  • 数据集大小: 22995917 字节

数据文件路径

prob-0.1

  • train: prob-0.1/train-*
  • test: prob-0.1/test-*
  • validation: prob-0.1/validation-*

prob-0.2

  • train: prob-0.2/train-*
  • test: prob-0.2/test-*
  • validation: prob-0.2/validation-*

prob-0.3

  • train: prob-0.3/train-*
  • test: prob-0.3/test-*
  • validation: prob-0.3/validation-*

prob-0.4

  • train: prob-0.4/train-*
  • test: prob-0.4/test-*
  • validation: prob-0.4/validation-*

prob-0.5

  • train: prob-0.5/train-*
  • test: prob-0.5/test-*
  • validation: prob-0.5/validation-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作