alvations/autotrain-data-aymara-t5-small
收藏数据集概述
数据集描述
本数据集是为项目“aymara-t5-small”自动处理的数据集,主要任务类别为翻译。
语言信息
数据集的语言BCP-47代码为unk。
数据集结构
数据实例
数据集中的样本示例如下:
json [ { "feat_Lang": "Spanish", "feat_langcode": "es", "feat_Source": "Janiw sartasipku00e4ti aka mayiw phuqasiu00f1apkama, presidentex nanakamp tantachaspan ukhamarak tama irnaqir jaqinakar tantachpan, kunawsas ukat kunjamraks munat wila masinakasar qallantani thaxtau00f1xa sasaw u201d huelga lurir Margarita Lu00f3pez mamax arsuwayatu00e4na.", "target": "u201cNo nos iremos hasta que nuestros casos se hayan resuelto, que el presidente se reu00fana con nosotros y que reu00fana a un grupo de tragbajo para decirnos cuu00e1ndo y cu00f3mo empezaru00e1n a encontrar a nuestros seres queridos u201d, declaru00f3 la huelguista de hambre Margarita Lu00f3pez.", "source": "translate Aymara to Spanish: Erwin C blog Latino Americano uka tuqinkiriw mu00e4 huelga lurir mamaru jawsayawayi:" }, { "feat_Lang": "English", "feat_langcode": "en", "feat_Source": "Credit: Heidi Shin.", "target": "Cru00e9dito: Heidi Shun.", "source": "translate English to Aymara: Credit: Heidi Shin." } ]
数据集字段
数据集包含以下字段:
json { "feat_Lang": "Value(dtype=string, id=None)", "feat_langcode": "Value(dtype=string, id=None)", "feat_Source": "Value(dtype=string, id=None)", "target": "Value(dtype=string, id=None)", "source": "Value(dtype=string, id=None)" }
数据集分割
数据集分为训练集和验证集,分割详情如下:
| 分割名称 | 样本数量 |
|---|---|
| 训练集 | 28121 |
| 验证集 | 7031 |



