lavi13/aya_en2ro_mixtral
收藏Hugging Face2024-02-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lavi13/aya_en2ro_mixtral
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是从英语翻译成罗马尼亚语的去重AYA条目,使用了Mixtral模型进行翻译。数据集由lavi13整理,语言为罗马尼亚语,旨在作为注释任务的输入数据,不直接用于指令调优,需要进一步的审查或注释。数据集的创建动机是扩展AYA数据集到未被代表的语言,并增加这些语言中指令任务的多样性。
该数据集是从英语翻译成罗马尼亚语的去重AYA条目,使用了Mixtral模型进行翻译。数据集由lavi13整理,语言为罗马尼亚语,旨在作为注释任务的输入数据,不直接用于指令调优,需要进一步的审查或注释。数据集的创建动机是扩展AYA数据集到未被代表的语言,并增加这些语言中指令任务的多样性。
提供机构:
lavi13
原始信息汇总
数据集卡片
数据集概述
Deduplicated AYA entries translated from English to Romanian using Mixtral.
数据集详情
数据集描述
- 语言(NLP): 罗马尼亚语
- 许可证: [需要更多信息]
- 仓库: [需要更多信息]
使用场景
该数据集旨在用作注释任务的输入数据。不应直接用于指令调优。预计需要进一步的审查或注释。
数据集创建
该数据集将AYA英语条目(来自https://huggingface.co/datasets/CohereForAI/aya_dataset)使用Mixtral(https://huggingface.co/mistralai/Mixtral-8x7B-Instruct-v0.1)翻译成罗马尼亚语。
创建动机
扩展AYA数据集到未被代表的语言,并增加AYA集合中此类语言的指令任务的多样性。



