wanhin/VinAI_PhoMT
收藏Hugging Face2024-05-17 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/wanhin/VinAI_PhoMT
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: en
dtype: string
- name: vi
dtype: string
splits:
- name: train
num_bytes: 542847683
num_examples: 2977999
download_size: 317623752
dataset_size: 542847683
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
- 特征字段:
1. 字段`en`(英语):数据类型为字符串
2. 字段`vi`(越南语):数据类型为字符串
- 数据划分:
训练集(train):字节大小为542,847,683,样本数量为2,977,999
- 基础参数:
下载大小为317,623,752,数据集总存储大小为542,847,683
- 配置项:
默认配置(default)下,对应训练集划分的数据文件存储路径为`data/train-*`
提供机构:
wanhin
原始信息汇总
数据集概述
数据特征
- 名称: en
- 数据类型: string
- 名称: vi
- 数据类型: string
数据分割
- 名称: train
- 字节数: 542847683
- 样本数: 2977999
数据集大小
- 下载大小: 317623752
- 数据集大小: 542847683
配置
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*
- 数据文件:



