five

gayanin/pubmed-abstracts-noised-with-babylon-dist

收藏
Hugging Face2024-02-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/gayanin/pubmed-abstracts-noised-with-babylon-dist
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: - config_name: prob-01 features: - name: refs dtype: string - name: trans dtype: string splits: - name: train num_bytes: 18320911 num_examples: 74724 - name: test num_bytes: 2347830 num_examples: 9341 - name: validation num_bytes: 2413396 num_examples: 9341 download_size: 13026640 dataset_size: 23082137 - config_name: prob-02 features: - name: refs dtype: string - name: trans dtype: string splits: - name: train num_bytes: 17827453 num_examples: 74724 - name: test num_bytes: 2285805 num_examples: 9341 - name: validation num_bytes: 2348871 num_examples: 9341 download_size: 13002600 dataset_size: 22462129 - config_name: prob-03 features: - name: refs dtype: string - name: trans dtype: string splits: - name: train num_bytes: 17341020 num_examples: 74724 - name: test num_bytes: 2221650 num_examples: 9341 - name: validation num_bytes: 2284656 num_examples: 9341 download_size: 12938958 dataset_size: 21847326 - config_name: prob-04 features: - name: refs dtype: string - name: trans dtype: string splits: - name: train num_bytes: 16853587 num_examples: 74724 - name: test num_bytes: 2160113 num_examples: 9341 - name: validation num_bytes: 2220913 num_examples: 9341 download_size: 12838916 dataset_size: 21234613 - config_name: prob-05 features: - name: refs dtype: string - name: trans dtype: string splits: - name: train num_bytes: 16365358 num_examples: 74724 - name: test num_bytes: 2097369 num_examples: 9341 - name: validation num_bytes: 2154463 num_examples: 9341 download_size: 12698776 dataset_size: 20617190 configs: - config_name: prob-01 data_files: - split: train path: prob-01/train-* - split: test path: prob-01/test-* - split: validation path: prob-01/validation-* - config_name: prob-02 data_files: - split: train path: prob-02/train-* - split: test path: prob-02/test-* - split: validation path: prob-02/validation-* - config_name: prob-03 data_files: - split: train path: prob-03/train-* - split: test path: prob-03/test-* - split: validation path: prob-03/validation-* - config_name: prob-04 data_files: - split: train path: prob-04/train-* - split: test path: prob-04/test-* - split: validation path: prob-04/validation-* - config_name: prob-05 data_files: - split: train path: prob-05/train-* - split: test path: prob-05/test-* - split: validation path: prob-05/validation-* ---
提供机构:
gayanin
原始信息汇总

数据集概述

数据集配置

prob-01

  • 特征:
    • refs: 字符串类型
    • trans: 字符串类型
  • 分割:
    • train: 18320911 字节, 74724 个样本
    • test: 2347830 字节, 9341 个样本
    • validation: 2413396 字节, 9341 个样本
  • 下载大小: 13026640 字节
  • 数据集大小: 23082137 字节

prob-02

  • 特征:
    • refs: 字符串类型
    • trans: 字符串类型
  • 分割:
    • train: 17827453 字节, 74724 个样本
    • test: 2285805 字节, 9341 个样本
    • validation: 2348871 字节, 9341 个样本
  • 下载大小: 13002600 字节
  • 数据集大小: 22462129 字节

prob-03

  • 特征:
    • refs: 字符串类型
    • trans: 字符串类型
  • 分割:
    • train: 17341020 字节, 74724 个样本
    • test: 2221650 字节, 9341 个样本
    • validation: 2284656 字节, 9341 个样本
  • 下载大小: 12938958 字节
  • 数据集大小: 21847326 字节

prob-04

  • 特征:
    • refs: 字符串类型
    • trans: 字符串类型
  • 分割:
    • train: 16853587 字节, 74724 个样本
    • test: 2160113 字节, 9341 个样本
    • validation: 2220913 字节, 9341 个样本
  • 下载大小: 12838916 字节
  • 数据集大小: 21234613 字节

prob-05

  • 特征:
    • refs: 字符串类型
    • trans: 字符串类型
  • 分割:
    • train: 16365358 字节, 74724 个样本
    • test: 2097369 字节, 9341 个样本
    • validation: 2154463 字节, 9341 个样本
  • 下载大小: 12698776 字节
  • 数据集大小: 20617190 字节

数据文件路径

  • prob-01:
    • train: prob-01/train-*
    • test: prob-01/test-*
    • validation: prob-01/validation-*
  • prob-02:
    • train: prob-02/train-*
    • test: prob-02/test-*
    • validation: prob-02/validation-*
  • prob-03:
    • train: prob-03/train-*
    • test: prob-03/test-*
    • validation: prob-03/validation-*
  • prob-04:
    • train: prob-04/train-*
    • test: prob-04/test-*
    • validation: prob-04/validation-*
  • prob-05:
    • train: prob-05/train-*
    • test: prob-05/test-*
    • validation: prob-05/validation-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作