Yudum/turkish-instruct-dataset
收藏Hugging Face2024-05-19 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Yudum/turkish-instruct-dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由四个现有的数据集组成:atasoglu/databricks-dolly-15k-tr的开放问题类别、parsak/alpaca-tr-1k-longest、TFLai/Turkish-Alpaca和umarigan/GPTeacher-General-Instruct-tr。数据集的特征包括输入、输出和指令,均为字符串类型。数据集包含一个训练分割,大小为41821751字节,包含82353个示例。下载大小为25783569字节,数据集大小为41821751字节。任务类别为文本生成,语言为土耳其语。
该数据集由四个现有的数据集组成:atasoglu/databricks-dolly-15k-tr的开放问题类别、parsak/alpaca-tr-1k-longest、TFLai/Turkish-Alpaca和umarigan/GPTeacher-General-Instruct-tr。数据集的特征包括输入、输出和指令,均为字符串类型。数据集包含一个训练分割,大小为41821751字节,包含82353个示例。下载大小为25783569字节,数据集大小为41821751字节。任务类别为文本生成,语言为土耳其语。
提供机构:
Yudum
原始信息汇总
数据集概述
数据集特征
- input: 数据类型为字符串。
- output: 数据类型为字符串。
- instruction: 数据类型为字符串。
数据集划分
- train: 包含82353个样本,数据大小为41821751字节。
数据集大小
- 下载大小: 25783569字节。
- 数据集大小: 41821751字节。
配置
- 默认配置: 训练数据文件路径为
data/train-*。
任务类别
- text-generation
语言
- tr



