thesistranslation/distilled-ccmatrix-fr-en
收藏Hugging Face2023-10-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/thesistranslation/distilled-ccmatrix-fr-en
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: int32
- name: translation
dtype:
translation:
languages:
- fr
- en
splits:
- name: train
num_bytes: 7513764655
num_examples: 30000000
download_size: 5154705851
dataset_size: 7513764655
language:
- fr
- en
---
# Dataset Card for "distilled-ccmatrix-fr-en"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
thesistranslation
原始信息汇总
数据集概述
数据集信息
-
特征:
id:数据类型为int32。translation:包含两种语言的翻译,分别是fr(法语)和en(英语)。
-
数据分割:
train:包含 30,000,000 个样本,总字节数为 7,513,764,655。
-
数据大小:
- 下载大小:5,154,705,851 字节。
- 数据集大小:7,513,764,655 字节。
语言
- 数据集包含法语(
fr)和英语(en)两种语言。



