five

efederici/alpaca-gpt4-it

收藏
Hugging Face2023-11-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/efederici/alpaca-gpt4-it
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含15209条从英语翻译成意大利语的指令,这些指令是通过`gpt-3.5-turbo`翻译的。原始数据集Alpaca GPT4包含52K条由GPT-4生成的指令跟随数据,格式与Alpaca数据相同,但输出由GPT-4生成。数据集仅用于研究目的,遵循CC BY NC 4.0许可证。

该数据集包含15209条从英语翻译成意大利语的指令,这些指令是通过`gpt-3.5-turbo`翻译的。原始数据集Alpaca GPT4包含52K条由GPT-4生成的指令跟随数据,格式与Alpaca数据相同,但输出由GPT-4生成。数据集仅用于研究目的,遵循CC BY NC 4.0许可证。
提供机构:
efederici
原始信息汇总

数据集概述

基本信息

  • 任务类别:text-generation
  • 语言:Italian (it)
  • 标签:alpaca, gpt4, it
  • 大小类别:10K<n<100K
  • 许可证:CC BY NC 2.0

数据集详情

  • 名称:Alpaca GPT4 English-to-Italian Translated Instructions (WIP)
  • 包含内容:15209条从英语翻译到意大利语的指令。
  • 原始数据集alpaca_gpt4_data.json,包含52K条由GPT-4生成的指令跟随数据,格式如下:
    • instruction:str,描述模型应执行的任务。
    • input:str,任务的上下文或输入,可选。
    • output:str,由GPT-4生成的指令答案。

许可证与使用限制

  • 许可证:CC BY NC 4.0,仅允许非商业用途。
  • 使用限制:数据集仅供研究使用,模型训练后不得用于研究以外的目的。

引用信息

@article{peng2023instruction, title={Instruction Tuning with GPT-4}, author={Peng, Baolin and Li, Chunyuan and He, Pengcheng and Galley, Michel and Gao, Jianfeng}, journal={arXiv preprint arXiv:2304.03277}, year={2023} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作