pinzhenchen/alpaca-cleaned-fr
收藏Hugging Face2024-03-06 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/pinzhenchen/alpaca-cleaned-fr
下载链接
链接失效反馈官方服务:
资源简介:
该HF数据仓库包含了用于单语与多语指令调优研究的法语Alpaca数据集。数据集是通过机器翻译从[yahma/alpaca-cleaned](https://huggingface.co/datasets/yahma/alpaca-cleaned)转换而来,主要用于法语指令调优。数据集包含约52K个实例,每个实例包含指令、输出和可选的输入。已知问题是机器翻译过程可能损坏了包含代码、跨语言任务、语法错误修正任务等的数据。
该HF数据仓库包含了用于单语与多语指令调优研究的法语Alpaca数据集。数据集是通过机器翻译从[yahma/alpaca-cleaned](https://huggingface.co/datasets/yahma/alpaca-cleaned)转换而来,主要用于法语指令调优。数据集包含约52K个实例,每个实例包含指令、输出和可选的输入。已知问题是机器翻译过程可能损坏了包含代码、跨语言任务、语法错误修正任务等的数据。
提供机构:
pinzhenchen
原始信息汇总
数据集描述
该数据集是用于研究单语与多语指令调优的法语Alpaca数据集。
创建
- 该数据集是从yahma/alpaca-cleaned机器翻译成法语的。
使用
- 该数据集旨在用于法语指令调优。
- 数据集包含约52K个实例,格式为JSON。
- 每个实例包含一个指令、一个输出和一个可选的输入。示例如下: json { "instruction": "Quelles sont les trois couleurs primaires ?", "input": "", "output": "Les trois couleurs primaires sont le rouge, le bleu et le jaune. Ces couleurs sont appelées primaires car elles ne peuvent pas être créées en mélangeant dautres couleurs et toutes les autres couleurs peuvent être faites en les combinant dans différentes proportions. Dans le système de couleur additif, utilisé pour la lumière, les couleurs primaires sont le rouge, le vert et le bleu (RGB)." }
已知问题
- 机器翻译过程可能损坏包含代码、跨语言任务、语法错误纠正任务等的数据。
引用
@inproceedings{chen-etal-2024-monolingual, title="Monolingual or multilingual instruction tuning: Which makes a better {Alpaca}", author="Pinzhen Chen and Shaoxiong Ji and Nikolay Bogoychev and Andrey Kutuzov and Barry Haddow and Kenneth Heafield", year="2024", booktitle = "Findings of the Association for Computational Linguistics: EACL 2024", }



