ImScientist/alpaca-cleaned-bg
收藏Hugging Face2024-06-23 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/ImScientist/alpaca-cleaned-bg
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是`yahma/alpaca-cleaned`的保加利亚语翻译子集,使用`gpt-3.5-turbo-0125`进行翻译。数据集包含三个特征:instruction、input和output,均为字符串类型。数据集只有一个训练集,包含10000个样本,大小为14685294字节。数据集的下载大小为7032749字节。
该数据集是`yahma/alpaca-cleaned`的保加利亚语翻译子集,使用`gpt-3.5-turbo-0125`进行翻译。数据集包含三个特征:instruction、input和output,均为字符串类型。数据集只有一个训练集,包含10000个样本,大小为14685294字节。数据集的下载大小为7032749字节。
提供机构:
ImScientist
原始信息汇总
数据集概述
许可证
- Apache 2.0
数据集信息
特征
- instruction: 类型为字符串
- input: 类型为字符串
- output: 类型为字符串
分割
- train:
- 字节数: 14685294
- 样本数: 10000
大小
- 下载大小: 7032749
- 数据集大小: 14685294
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



