iamnguyen/pubmed-envi
收藏Hugging Face2024-04-21 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/iamnguyen/pubmed-envi
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个配置(set_1到set_21),每个配置包含一个训练集,每个训练集包含1000个样本。数据特征为英越互译,具体包括英文和越南文的字符串序列。每个配置的下载大小和数据集大小也提供了详细信息。
该数据集包含多个配置(set_1到set_21),每个配置包含一个训练集,每个训练集包含1000个样本。数据特征为英越互译,具体包括英文和越南文的字符串序列。每个配置的下载大小和数据集大小也提供了详细信息。
提供机构:
iamnguyen
原始信息汇总
数据集概述
数据集配置
set_1
- 特征:
translation:en: 字符串序列vi: 字符串序列
- 分割:
train:- 字节数: 1176304
- 样本数: 1000
- 下载大小: 638753
- 数据集大小: 1176304
set_10
- 特征:
translation:en: 字符串序列vi: 字符串序列
- 分割:
train:- 字节数: 1188955
- 样本数: 1000
- 下载大小: 642886
- 数据集大小: 1188955
set_11
- 特征:
translation:en: 字符串序列vi: 字符串序列
- 分割:
train:- 字节数: 1066667
- 样本数: 1000
- 下载大小: 577921
- 数据集大小: 1066667
set_12
- 特征:
translation:en: 字符串序列vi: 字符串序列
- 分割:
train:- 字节数: 1160442
- 样本数: 1000
- 下载大小: 619224
- 数据集大小: 1160442
set_13
- 特征:
translation:en: 字符串序列vi: 字符串序列
- 分割:
train:- 字节数: 1298099
- 样本数: 1000
- 下载大小: 692134
- 数据集大小: 1298099
set_14
- 特征:
translation:en: 字符串序列vi: 字符串序列
- 分割:
train:- 字节数: 1407840
- 样本数: 1000
- 下载大小: 749967
- 数据集大小: 1407840
set_15
- 特征:
translation:en: 字符串序列vi: 字符串序列
- 分割:
train:- 字节数: 1339082
- 样本数: 1000
- 下载大小: 719109
- 数据集大小: 1339082
set_16
- 特征:
translation:en: 字符串序列vi: 字符串序列
- 分割:
train:- 字节数: 1372192
- 样本数: 1000
- 下载大小: 735900
- 数据集大小: 1372192
set_17
- 特征:
translation:en: 字符串序列vi: 字符串序列
- 分割:
train:- 字节数: 1372827
- 样本数: 1000
- 下载大小: 733694
- 数据集大小: 1372827
set_18
- 特征:
translation:en: 字符串序列vi: 字符串序列
- 分割:
train:- 字节数: 1311599
- 样本数: 1000
- 下载大小: 698598
- 数据集大小: 1311599
set_19
- 特征:
translation:en: 字符串序列vi: 字符串序列
- 分割:
train:- 字节数: 1270574
- 样本数: 1000
- 下载大小: 685848
- 数据集大小: 1270574
set_2
- 特征:
translation:en: 字符串序列vi: 字符串序列
- 分割:
train:- 字节数: 1131429
- 样本数: 1000
- 下载大小: 611440
- 数据集大小: 1131429
set_20
- 特征:
translation:en: 字符串序列vi: 字符串序列
- 分割:
train:- 字节数: 1372107
- 样本数: 1000
- 下载大小: 734242
- 数据集大小: 1372107
set_21
- 特征:
translation:en: 字符串序列vi: 字符串序列
- 分割:
train:- 字节数: 1245080
- 样本数: 1000
- 下载大小: 673238
- 数据集大小: 1245080
set_3
- 特征:
translation:en: 字符串序列vi: 字符串序列
- 分割:
train:- 字节数: 1117271
- 样本数: 1000
- 下载大小: 607867
- 数据集大小: 1117271
set_4
- 特征:
translation:en: 字符串序列vi: 字符串序列
- 分割:
train:- 字节数: 1152418
- 样本数: 1000
- 下载大小: 619434
- 数据集大小: 1152418
set_5
- 特征:
translation:en: 字符串序列vi: 字符串序列
- 分割:
train:- 字节数: 1128140
- 样本数: 1000
- 下载大小: 607678
- 数据集大小: 1128140
set_6
- 特征:
translation:en: 字符串序列vi: 字符串序列
- 分割:
train:- 字节数: 1113067
- 样本数: 1000
- 下载大小: 601645
- 数据集大小: 1113067
set_7
- 特征:
translation:en: 字符串序列vi: 字符串序列
- 分割:
train:- 字节数: 1188873
- 样本数: 1000
- 下载大小: 634235
- 数据集大小: 1188873
set_8
- 特征:
translation:en: 字符串序列vi: 字符串序列
- 分割:
train:- 字节数: 1173177
- 样本数: 1000
- 下载大小: 635017
- 数据集大小: 1173177
set_9
- 特征:
translation:en: 字符串序列vi: 字符串序列
- 分割:
train:- 字节数: 1125649
- 样本数: 1000
- 下载大小: 604705
- 数据集大小: 1125649



