ecoue/wmt19_de-en_tokenized
收藏Hugging Face2023-02-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ecoue/wmt19_de-en_tokenized
下载链接
链接失效反馈官方服务:
资源简介:
---
license: mit
dataset_info:
features:
- name: de
sequence: uint16
- name: en
sequence: uint16
splits:
- name: train
num_bytes: 251652546
num_examples: 2238991
- name: validation
num_bytes: 245832
num_examples: 2015
download_size: 299858004
dataset_size: 251898378
---
提供机构:
ecoue
原始信息汇总
数据集概述
数据集特征
- de: 数据类型为
uint16。 - en: 数据类型为
uint16。
数据集分割
- 训练集:
- 数据量: 2238991个样本
- 存储大小: 251652546字节
- 验证集:
- 数据量: 2015个样本
- 存储大小: 245832字节
数据集大小
- 下载大小: 299858004字节
- 数据集总大小: 251898378字节
许可证
- MIT许可证



