HugginJake/ccmatrix10-it-de
收藏Hugging Face2024-07-08 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/HugginJake/ccmatrix10-it-de
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两个主要特征:id和translation。id特征的数据类型为int64,而translation特征是一个结构体,包含两个子特征:de和it,它们的数据类型均为string。数据集包含一个名为train的分割,该分割的大小为438234556字节,包含1731620个示例。数据集的下载大小为302901263字节,数据集的总大小为438234556字节。
The dataset contains two main features: id and translation. The id feature has a data type of int64, and the translation feature is a structure containing two sub-features: de and it, both of which have a data type of string. The dataset includes a split named train, which is 438234556 bytes in size and contains 1731620 examples. The download size of the dataset is 302901263 bytes, and the total size of the dataset is 438234556 bytes.
提供机构:
HugginJake
原始信息汇总
数据集概述
数据集特征
- id: 数据类型为
int64。 - translation: 包含以下子字段:
- de: 数据类型为
string。 - it: 数据类型为
string。
- de: 数据类型为
数据集分割
- train: 包含 1,731,620 个样本,占用 438,234,556 字节。
数据集大小
- 下载大小: 302,901,263 字节。
- 数据集大小: 438,234,556 字节。
配置
- default:
- 数据文件路径:
data/train-*。
- 数据文件路径:



