five

lavi13/aya_en2ro_mixtral

收藏
Hugging Face2024-02-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lavi13/aya_en2ro_mixtral
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是从英语翻译成罗马尼亚语的去重AYA条目,使用了Mixtral模型进行翻译。数据集由lavi13整理,语言为罗马尼亚语,旨在作为注释任务的输入数据,不直接用于指令调优,需要进一步的审查或注释。数据集的创建动机是扩展AYA数据集到未被代表的语言,并增加这些语言中指令任务的多样性。

该数据集是从英语翻译成罗马尼亚语的去重AYA条目,使用了Mixtral模型进行翻译。数据集由lavi13整理,语言为罗马尼亚语,旨在作为注释任务的输入数据,不直接用于指令调优,需要进一步的审查或注释。数据集的创建动机是扩展AYA数据集到未被代表的语言,并增加这些语言中指令任务的多样性。
提供机构:
lavi13
原始信息汇总

数据集卡片

数据集概述

Deduplicated AYA entries translated from English to Romanian using Mixtral.

数据集详情

数据集描述

  • 语言(NLP): 罗马尼亚语
  • 许可证: [需要更多信息]
  • 仓库: [需要更多信息]

使用场景

该数据集旨在用作注释任务的输入数据。不应直接用于指令调优。预计需要进一步的审查或注释。

数据集创建

该数据集将AYA英语条目(来自https://huggingface.co/datasets/CohereForAI/aya_dataset)使用Mixtral(https://huggingface.co/mistralai/Mixtral-8x7B-Instruct-v0.1)翻译成罗马尼亚语。

创建动机

扩展AYA数据集到未被代表的语言,并增加AYA集合中此类语言的指令任务的多样性。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作