five

warrormac/autotrain-data-my-train

收藏
Hugging Face2022-11-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/warrormac/autotrain-data-my-train
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是由AutoTrain自动处理的,用于项目my-train。数据集的语言代码为en2es,表示从英语到西班牙语的翻译任务。数据集包含多个字段,其中主要字段为source和target,分别表示源语言和目标语言的文本。数据集还包含多个未命名字段,这些字段的值均为null。数据集被分为训练集和验证集,训练集包含2028个样本,验证集包含507个样本。
提供机构:
warrormac
原始信息汇总

数据集概述

数据集描述

该数据集是为项目“my-train”自动处理的数据集,主要用于翻译任务。

语言

数据集的语言编码为en2es,涉及英语到西班牙语的翻译。

数据集结构

数据实例

数据集中的样本包含以下字段:

  • feat_eng: 英文特征
  • feat_spa: 西班牙文特征
  • source: 源语言文本
  • target: 目标语言文本
  • feat_Unnamed: 4feat_Unnamed: 17: 未命名的字段,值为null

数据集字段

数据集包含以下字段:

  • feat_eng: 字符串类型
  • feat_spa: 字符串类型
  • source: 字符串类型
  • target: 字符串类型
  • feat_Unnamed: 4feat_Unnamed: 17: 字符串类型,值为null

数据集分割

数据集分为训练集和验证集,具体分割如下:

分割名称 样本数量
训练集 2028
验证集 507
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作