ASIDS/alpaca-cleaned-ru
收藏Hugging Face2023-10-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ASIDS/alpaca-cleaned-ru
下载链接
链接失效反馈官方服务:
资源简介:
alpaca-cleaned-ru数据集是yahma/alpaca-cleaned数据集的俄语翻译版本。该数据集包含三个特征:instruction(指令)、output(输出)和iteration(迭代次数)。数据集分为一个训练集,包含51,760个样本,总大小为74,829,755字节。数据集的许可证为cc-by-4.0,语言为俄语,属于单语言数据集,标签为instruction-finetuning,任务类别为text-generation,规模类别为10K<n<100K。数据集的来源是yahma/alpaca-cleaned,语言创建者为translated。
提供机构:
ASIDS
原始信息汇总
alpaca-cleaned-ru 数据集概述
数据集信息
特征
- instruction: 数据类型为字符串(string)
- output: 数据类型为字符串(string)
- iteration: 数据类型为无符号32位整数(uint32)
数据分割
- train: 包含51760个样本,总字节数为74829755.0
数据大小
- 下载大小: 36596664字节
- 数据集大小: 74829755.0字节
许可证
- cc-by-4.0
语言
- 俄语(ru)
多语言性
- 单语种(monolingual)
标签
- instruction-finetuning
任务类别
- 文本生成(text-generation)
大小类别
- 10K<n<100K
源数据集
- yahma/alpaca-cleaned
语言创建者
- translated
数据集描述
- 数据集名称: alpaca-cleaned-ru
- 数据集来源: yahma/alpaca-cleaned 的俄语翻译版本



