five

iamnguyen/pubmed-envi

收藏
Hugging Face2024-04-21 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/iamnguyen/pubmed-envi
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个配置(set_1到set_21),每个配置包含一个训练集,每个训练集包含1000个样本。数据特征为英越互译,具体包括英文和越南文的字符串序列。每个配置的下载大小和数据集大小也提供了详细信息。

该数据集包含多个配置(set_1到set_21),每个配置包含一个训练集,每个训练集包含1000个样本。数据特征为英越互译,具体包括英文和越南文的字符串序列。每个配置的下载大小和数据集大小也提供了详细信息。
提供机构:
iamnguyen
原始信息汇总

数据集概述

数据集配置

set_1

  • 特征:
    • translation:
      • en: 字符串序列
      • vi: 字符串序列
  • 分割:
    • train:
      • 字节数: 1176304
      • 样本数: 1000
  • 下载大小: 638753
  • 数据集大小: 1176304

set_10

  • 特征:
    • translation:
      • en: 字符串序列
      • vi: 字符串序列
  • 分割:
    • train:
      • 字节数: 1188955
      • 样本数: 1000
  • 下载大小: 642886
  • 数据集大小: 1188955

set_11

  • 特征:
    • translation:
      • en: 字符串序列
      • vi: 字符串序列
  • 分割:
    • train:
      • 字节数: 1066667
      • 样本数: 1000
  • 下载大小: 577921
  • 数据集大小: 1066667

set_12

  • 特征:
    • translation:
      • en: 字符串序列
      • vi: 字符串序列
  • 分割:
    • train:
      • 字节数: 1160442
      • 样本数: 1000
  • 下载大小: 619224
  • 数据集大小: 1160442

set_13

  • 特征:
    • translation:
      • en: 字符串序列
      • vi: 字符串序列
  • 分割:
    • train:
      • 字节数: 1298099
      • 样本数: 1000
  • 下载大小: 692134
  • 数据集大小: 1298099

set_14

  • 特征:
    • translation:
      • en: 字符串序列
      • vi: 字符串序列
  • 分割:
    • train:
      • 字节数: 1407840
      • 样本数: 1000
  • 下载大小: 749967
  • 数据集大小: 1407840

set_15

  • 特征:
    • translation:
      • en: 字符串序列
      • vi: 字符串序列
  • 分割:
    • train:
      • 字节数: 1339082
      • 样本数: 1000
  • 下载大小: 719109
  • 数据集大小: 1339082

set_16

  • 特征:
    • translation:
      • en: 字符串序列
      • vi: 字符串序列
  • 分割:
    • train:
      • 字节数: 1372192
      • 样本数: 1000
  • 下载大小: 735900
  • 数据集大小: 1372192

set_17

  • 特征:
    • translation:
      • en: 字符串序列
      • vi: 字符串序列
  • 分割:
    • train:
      • 字节数: 1372827
      • 样本数: 1000
  • 下载大小: 733694
  • 数据集大小: 1372827

set_18

  • 特征:
    • translation:
      • en: 字符串序列
      • vi: 字符串序列
  • 分割:
    • train:
      • 字节数: 1311599
      • 样本数: 1000
  • 下载大小: 698598
  • 数据集大小: 1311599

set_19

  • 特征:
    • translation:
      • en: 字符串序列
      • vi: 字符串序列
  • 分割:
    • train:
      • 字节数: 1270574
      • 样本数: 1000
  • 下载大小: 685848
  • 数据集大小: 1270574

set_2

  • 特征:
    • translation:
      • en: 字符串序列
      • vi: 字符串序列
  • 分割:
    • train:
      • 字节数: 1131429
      • 样本数: 1000
  • 下载大小: 611440
  • 数据集大小: 1131429

set_20

  • 特征:
    • translation:
      • en: 字符串序列
      • vi: 字符串序列
  • 分割:
    • train:
      • 字节数: 1372107
      • 样本数: 1000
  • 下载大小: 734242
  • 数据集大小: 1372107

set_21

  • 特征:
    • translation:
      • en: 字符串序列
      • vi: 字符串序列
  • 分割:
    • train:
      • 字节数: 1245080
      • 样本数: 1000
  • 下载大小: 673238
  • 数据集大小: 1245080

set_3

  • 特征:
    • translation:
      • en: 字符串序列
      • vi: 字符串序列
  • 分割:
    • train:
      • 字节数: 1117271
      • 样本数: 1000
  • 下载大小: 607867
  • 数据集大小: 1117271

set_4

  • 特征:
    • translation:
      • en: 字符串序列
      • vi: 字符串序列
  • 分割:
    • train:
      • 字节数: 1152418
      • 样本数: 1000
  • 下载大小: 619434
  • 数据集大小: 1152418

set_5

  • 特征:
    • translation:
      • en: 字符串序列
      • vi: 字符串序列
  • 分割:
    • train:
      • 字节数: 1128140
      • 样本数: 1000
  • 下载大小: 607678
  • 数据集大小: 1128140

set_6

  • 特征:
    • translation:
      • en: 字符串序列
      • vi: 字符串序列
  • 分割:
    • train:
      • 字节数: 1113067
      • 样本数: 1000
  • 下载大小: 601645
  • 数据集大小: 1113067

set_7

  • 特征:
    • translation:
      • en: 字符串序列
      • vi: 字符串序列
  • 分割:
    • train:
      • 字节数: 1188873
      • 样本数: 1000
  • 下载大小: 634235
  • 数据集大小: 1188873

set_8

  • 特征:
    • translation:
      • en: 字符串序列
      • vi: 字符串序列
  • 分割:
    • train:
      • 字节数: 1173177
      • 样本数: 1000
  • 下载大小: 635017
  • 数据集大小: 1173177

set_9

  • 特征:
    • translation:
      • en: 字符串序列
      • vi: 字符串序列
  • 分割:
    • train:
      • 字节数: 1125649
      • 样本数: 1000
  • 下载大小: 604705
  • 数据集大小: 1125649
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作