universitytehran/TED2020
收藏Hugging Face2024-12-05 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/universitytehran/TED2020
下载链接
链接失效反馈官方服务:
资源简介:
这是一个基于TED2020的翻译数据集,包含波斯语到英语和英语到波斯语的翻译方向。数据集的特征包括instruction、input和output,均为字符串类型。数据集包含一个训练集分割,有300,000个示例,大小为102,980,969字节。下载大小为47,159,482字节,数据集大小为102,980,969字节。配置部分指定了默认配置,数据文件路径为data/train-*。任务类别为翻译,语言为波斯语(fa)和英语(en)。
This is a translation dataset based on TED2020, containing Fa→En and En→Fa directions. The dataset features include instruction, input, and output, with 300,000 samples in the training set.
提供机构:
universitytehran



