bertin-project/alpaca-spanish
收藏Hugging Face2023-03-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/bertin-project/alpaca-spanish
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是Alpaca数据集的西班牙语翻译版本,原始数据集由斯坦福大学制作。早期版本使用了Facebook的NLLB 1.3B模型进行翻译,但当前版本使用了OpenAI的gpt-3.5-turbo模型。因此,该数据集不能用于创建与OpenAI竞争的任何模型。数据集包含指令、输入和输出三个特征,主要用于文本生成任务。
该数据集是Alpaca数据集的西班牙语翻译版本,原始数据集由斯坦福大学制作。早期版本使用了Facebook的NLLB 1.3B模型进行翻译,但当前版本使用了OpenAI的gpt-3.5-turbo模型。因此,该数据集不能用于创建与OpenAI竞争的任何模型。数据集包含指令、输入和输出三个特征,主要用于文本生成任务。
提供机构:
bertin-project
原始信息汇总
数据集概述
基本信息
- 许可证: CC-BY-4.0
- 语言: 西班牙语 (es)
- 标签: 指令微调
- 任务类别: 文本生成
数据集详细信息
- 特征:
- instruction: 数据类型为字符串
- input: 数据类型为字符串
- output: 数据类型为字符串
- 分割:
- 训练集:
- 字节数: 21439975
- 示例数: 51942
- 训练集:
- 下载大小: 13178075
- 数据集大小: 21439975
数据集来源
- 该数据集是alpaca_data_cleaned.json的西班牙语翻译版本,原数据集为Stanford制作的Alpaca数据集的清洁版。
数据集使用限制
- 当前版本使用OpenAI的
gpt-3.5-turbo模型,因此该数据集不能用于创建与OpenAI竞争的任何模型。



