five

praveensonu/alpaca_it_6k

收藏
Hugging Face2024-01-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/praveensonu/alpaca_it_6k
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是从原始的Stanford Alpaca 52k指令集翻译而来,使用了Free DeepL API将指令翻译成意大利语。数据集包含了6353条指令,每条指令都是唯一的。数据集的结构包括instruction(描述模型应执行的任务)、input(任务的可选上下文或输入)、output(由text-davinci-003生成的指令的翻译答案)和instruction_id(每条指令的唯一ID)。此外,所有与编码相关的指令和输出都被移除,因为DeepL对代码的翻译结果不准确。

该数据集是从原始的Stanford Alpaca 52k指令集翻译而来,使用了Free DeepL API将指令翻译成意大利语。数据集包含了6353条指令,每条指令都是唯一的。数据集的结构包括instruction(描述模型应执行的任务)、input(任务的可选上下文或输入)、output(由text-davinci-003生成的指令的翻译答案)和instruction_id(每条指令的唯一ID)。此外,所有与编码相关的指令和输出都被移除,因为DeepL对代码的翻译结果不准确。
提供机构:
praveensonu
原始信息汇总

数据集卡片

数据集概述

该数据集是从原始的Stanford Alpaca 52k指令集翻译而来的,使用Free DeepL API积分翻译成意大利语。共翻译了6353条指令。

数据集描述

数据组成

  • instruction: 描述模型应执行的任务。每条指令都是唯一的。
  • input: 任务的可选上下文或输入。例如,当指令是“总结以下文章”时,输入是文章。
  • output: 由text-davinci-003生成的指令的翻译答案。
  • instruction_id: 从0开始为每条指令分配的ID。如果需要对Alpaca数据集进行进一步翻译,可以使用此ID。

所有与编程相关的指令和输出均已删除,因为DeepL对代码的翻译结果是乱码。

数据集来源

数据集来源于Stanford Alpaca。

局限性

用户应注意数据集的风险、偏见和技术局限性。数据集使用DeepL翻译,但未进行人工评估。此外,与代码相关的指令已被省略。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作