thesistranslation/distilled-ccmatrix-en-de
收藏Hugging Face2023-10-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/thesistranslation/distilled-ccmatrix-en-de
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: int32
- name: translation
dtype:
translation:
languages:
- en
- de
splits:
- name: train
num_bytes: 7294036621
num_examples: 30000000
download_size: 5135500985
dataset_size: 7294036621
language:
- en
- de
---
# Dataset Card for "distilled-ccmatrix-en-de"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
thesistranslation
原始信息汇总
数据集概述
数据集信息
-
特征:
- id: 数据类型为
int32。 - translation: 包含两种语言的翻译,分别是
en(英语)和de(德语)。
- id: 数据类型为
-
拆分:
- train: 包含 30,000,000 个样本,总字节数为 7,294,036,621。
-
大小:
- 下载大小: 5,135,500,985 字节。
- 数据集大小: 7,294,036,621 字节。
语言
- 英语 (en)
- 德语 (de)



