erickfmm/OpenLongCoT-Pretrain-ES
收藏Hugging Face2024-12-06 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/erickfmm/OpenLongCoT-Pretrain-ES
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个文本生成任务的数据集,语言为西班牙语,数据规模在10万到100万之间。数据集是从qq8933/OpenLongCoT-Pretrain翻译成西班牙语的,使用了Helsinki-NLP/opus-mt-en-es模型进行翻译。数据处理的代码和模型可在文件部分找到。
This dataset is a text generation task dataset translated from English to Spanish, with the language being Spanish and the size ranging from 100K to 1M. The translation was done using the Helsinki-NLP/opus-mt-en-es model.
提供机构:
erickfmm



