warrormac/autotrain-data-my-train
收藏Hugging Face2022-11-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/warrormac/autotrain-data-my-train
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是由AutoTrain自动处理的,用于项目my-train。数据集的语言代码为en2es,表示从英语到西班牙语的翻译任务。数据集包含多个字段,其中主要字段为source和target,分别表示源语言和目标语言的文本。数据集还包含多个未命名字段,这些字段的值均为null。数据集被分为训练集和验证集,训练集包含2028个样本,验证集包含507个样本。
提供机构:
warrormac
原始信息汇总
数据集概述
数据集描述
该数据集是为项目“my-train”自动处理的数据集,主要用于翻译任务。
语言
数据集的语言编码为en2es,涉及英语到西班牙语的翻译。
数据集结构
数据实例
数据集中的样本包含以下字段:
feat_eng: 英文特征feat_spa: 西班牙文特征source: 源语言文本target: 目标语言文本feat_Unnamed: 4至feat_Unnamed: 17: 未命名的字段,值为null
数据集字段
数据集包含以下字段:
feat_eng: 字符串类型feat_spa: 字符串类型source: 字符串类型target: 字符串类型feat_Unnamed: 4至feat_Unnamed: 17: 字符串类型,值为null
数据集分割
数据集分为训练集和验证集,具体分割如下:
| 分割名称 | 样本数量 |
|---|---|
| 训练集 | 2028 |
| 验证集 | 507 |



