five

speedcell4/opus-scratch

收藏
Hugging Face2024-10-15 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/speedcell4/opus-scratch
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个字段,包括文本序列(text1和text2)、语言类型(lang1和lang2)以及文本大小(size1和size2)。数据集被分为训练集(train)、开发集(dev)、测试集(test)和零样本集(zero)四个部分,每个部分都有相应的文件大小和示例数量。数据集的下载大小为3876113896字节,总大小为15216020420.393087字节。

The dataset contains multiple fields, including text sequences (text1 and text2), language types (lang1 and lang2), and text sizes (size1 and size2). The dataset is divided into four parts: train, dev, test, and zero, each with corresponding file sizes and example counts. The download size of the dataset is 3876113896 bytes, and the total size is 15216020420.393087 bytes.
提供机构:
speedcell4
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作