five

gayanin/babylon-native-mixed

收藏
Hugging Face2024-01-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/gayanin/babylon-native-mixed
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: - config_name: prob-0.1 features: - name: refs dtype: string - name: trans dtype: string splits: - name: train num_bytes: 707260 num_examples: 5293 - name: test num_bytes: 79603 num_examples: 662 - name: validation num_bytes: 77176 num_examples: 662 download_size: 498401 dataset_size: 864039 - config_name: prob-0.2 features: - name: refs dtype: string - name: trans dtype: string splits: - name: train num_bytes: 707658 num_examples: 5293 - name: test num_bytes: 79464 num_examples: 662 - name: validation num_bytes: 77409 num_examples: 662 download_size: 513529 dataset_size: 864531 - config_name: prob-0.3 features: - name: refs dtype: string - name: trans dtype: string splits: - name: train num_bytes: 707952 num_examples: 5293 - name: test num_bytes: 79465 num_examples: 662 - name: validation num_bytes: 77440 num_examples: 662 download_size: 525969 dataset_size: 864857 - config_name: prob-0.4 features: - name: refs dtype: string - name: trans dtype: string splits: - name: train num_bytes: 708853 num_examples: 5293 - name: test num_bytes: 79806 num_examples: 662 - name: validation num_bytes: 77283 num_examples: 662 download_size: 536929 dataset_size: 865942 - config_name: prob-0.5 features: - name: refs dtype: string - name: trans dtype: string splits: - name: train num_bytes: 709628 num_examples: 5293 - name: test num_bytes: 79791 num_examples: 662 - name: validation num_bytes: 77038 num_examples: 662 download_size: 545198 dataset_size: 866457 configs: - config_name: prob-0.1 data_files: - split: train path: prob-0.1/train-* - split: test path: prob-0.1/test-* - split: validation path: prob-0.1/validation-* - config_name: prob-0.2 data_files: - split: train path: prob-0.2/train-* - split: test path: prob-0.2/test-* - split: validation path: prob-0.2/validation-* - config_name: prob-0.3 data_files: - split: train path: prob-0.3/train-* - split: test path: prob-0.3/test-* - split: validation path: prob-0.3/validation-* - config_name: prob-0.4 data_files: - split: train path: prob-0.4/train-* - split: test path: prob-0.4/test-* - split: validation path: prob-0.4/validation-* - config_name: prob-0.5 data_files: - split: train path: prob-0.5/train-* - split: test path: prob-0.5/test-* - split: validation path: prob-0.5/validation-* ---
提供机构:
gayanin
原始信息汇总

数据集概述

数据集配置

prob-0.1

  • 特征:
    • refs: 字符串类型
    • trans: 字符串类型
  • 分割:
    • train: 707260 字节, 5293 个样本
    • test: 79603 字节, 662 个样本
    • validation: 77176 字节, 662 个样本
  • 下载大小: 498401 字节
  • 数据集大小: 864039 字节

prob-0.2

  • 特征:
    • refs: 字符串类型
    • trans: 字符串类型
  • 分割:
    • train: 707658 字节, 5293 个样本
    • test: 79464 字节, 662 个样本
    • validation: 77409 字节, 662 个样本
  • 下载大小: 513529 字节
  • 数据集大小: 864531 字节

prob-0.3

  • 特征:
    • refs: 字符串类型
    • trans: 字符串类型
  • 分割:
    • train: 707952 字节, 5293 个样本
    • test: 79465 字节, 662 个样本
    • validation: 77440 字节, 662 个样本
  • 下载大小: 525969 字节
  • 数据集大小: 864857 字节

prob-0.4

  • 特征:
    • refs: 字符串类型
    • trans: 字符串类型
  • 分割:
    • train: 708853 字节, 5293 个样本
    • test: 79806 字节, 662 个样本
    • validation: 77283 字节, 662 个样本
  • 下载大小: 536929 字节
  • 数据集大小: 865942 字节

prob-0.5

  • 特征:
    • refs: 字符串类型
    • trans: 字符串类型
  • 分割:
    • train: 709628 字节, 5293 个样本
    • test: 79791 字节, 662 个样本
    • validation: 77038 字节, 662 个样本
  • 下载大小: 545198 字节
  • 数据集大小: 866457 字节

数据文件路径

prob-0.1

  • train: prob-0.1/train-*
  • test: prob-0.1/test-*
  • validation: prob-0.1/validation-*

prob-0.2

  • train: prob-0.2/train-*
  • test: prob-0.2/test-*
  • validation: prob-0.2/validation-*

prob-0.3

  • train: prob-0.3/train-*
  • test: prob-0.3/test-*
  • validation: prob-0.3/validation-*

prob-0.4

  • train: prob-0.4/train-*
  • test: prob-0.4/test-*
  • validation: prob-0.4/validation-*

prob-0.5

  • train: prob-0.5/train-*
  • test: prob-0.5/test-*
  • validation: prob-0.5/validation-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作