five

mhmtcrkglu/autotrain-data-test-translation-t5-small

收藏
Hugging Face2023-10-31 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mhmtcrkglu/autotrain-data-test-translation-t5-small
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由AutoTrain自动处理,用于test-translation-t5-small项目。数据集包含源语言和目标语言的文本对,主要用于翻译任务。数据集的BCP-47语言代码为unk,表示语言未明确指定。数据集结构包括数据实例和字段描述,数据实例展示了源文本和目标文本的对应关系,字段包括source和target,均为字符串类型。数据集分为训练集和验证集,分别包含24和6个样本。

This dataset was automatically processed by AutoTrain for the test-translation-t5-small project. It consists of text pairs in source and target languages, primarily used for translation tasks. The BCP-47 language code of the dataset is unk, indicating that the language is not explicitly specified. The dataset structure includes data instances and field descriptions. The data instances demonstrate the correspondence between source text and target text, with the fields being source and target, both of string type. The dataset is divided into training and validation sets, which contain 24 and 6 samples respectively.
提供机构:
mhmtcrkglu
原始信息汇总

AutoTrain Dataset for project: test-translation-t5-small

数据集描述

该数据集由AutoTrain自动处理,用于项目test-translation-t5-small。

语言

数据集的语言BCP-47代码为unk。

数据集结构

数据实例

数据集的一个样本如下:

json [ { "source": "TrueMood", "target": "u062au0631u0646u0648u062f" }, { "source": "cleanwax", "target": "u0643u0644u064au0646u0648u0627u0643u0633" } ]

数据字段

数据集包含以下字段(也称为“特征”):

json { "source": "Value(dtype=string, id=None)", "target": "Value(dtype=string, id=None)" }

数据集分割

数据集分为训练集和验证集,分割大小如下:

分割名称 样本数量
train 24
valid 6
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作