praveensonu/alpaca_it_6k
收藏Hugging Face2024-01-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/praveensonu/alpaca_it_6k
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是从原始的Stanford Alpaca 52k指令集翻译而来,使用了Free DeepL API将指令翻译成意大利语。数据集包含了6353条指令,每条指令都是唯一的。数据集的结构包括instruction(描述模型应执行的任务)、input(任务的可选上下文或输入)、output(由text-davinci-003生成的指令的翻译答案)和instruction_id(每条指令的唯一ID)。此外,所有与编码相关的指令和输出都被移除,因为DeepL对代码的翻译结果不准确。
该数据集是从原始的Stanford Alpaca 52k指令集翻译而来,使用了Free DeepL API将指令翻译成意大利语。数据集包含了6353条指令,每条指令都是唯一的。数据集的结构包括instruction(描述模型应执行的任务)、input(任务的可选上下文或输入)、output(由text-davinci-003生成的指令的翻译答案)和instruction_id(每条指令的唯一ID)。此外,所有与编码相关的指令和输出都被移除,因为DeepL对代码的翻译结果不准确。
提供机构:
praveensonu
原始信息汇总
数据集卡片
数据集概述
该数据集是从原始的Stanford Alpaca 52k指令集翻译而来的,使用Free DeepL API积分翻译成意大利语。共翻译了6353条指令。
数据集描述
数据组成
- instruction: 描述模型应执行的任务。每条指令都是唯一的。
- input: 任务的可选上下文或输入。例如,当指令是“总结以下文章”时,输入是文章。
- output: 由text-davinci-003生成的指令的翻译答案。
- instruction_id: 从0开始为每条指令分配的ID。如果需要对Alpaca数据集进行进一步翻译,可以使用此ID。
所有与编程相关的指令和输出均已删除,因为DeepL对代码的翻译结果是乱码。
数据集来源
数据集来源于Stanford Alpaca。
局限性
用户应注意数据集的风险、偏见和技术局限性。数据集使用DeepL翻译,但未进行人工评估。此外,与代码相关的指令已被省略。



