jtatman/fortuna_instruction_format
收藏Hugging Face2024-01-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/jtatman/fortuna_instruction_format
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是对Samantha数据集的重新格式化,采用了Alpaca格式,并包含了一个ChatML格式的文本列以便于使用。数据集的特征包括input、output、text和instruction,均为字符串类型。数据集包含一个训练分割,有34687个示例。数据集的任务类别包括问答和对话,语言为英语,标签包括dolphin、samantha和reformatted。数据集的名称是fortuna,大小类别为10K<n<100K。
该数据集是对Samantha数据集的重新格式化,采用了Alpaca格式,并包含了一个ChatML格式的文本列以便于使用。数据集的特征包括input、output、text和instruction,均为字符串类型。数据集包含一个训练分割,有34687个示例。数据集的任务类别包括问答和对话,语言为英语,标签包括dolphin、samantha和reformatted。数据集的名称是fortuna,大小类别为10K<n<100K。
提供机构:
jtatman
原始信息汇总
数据集概述
数据集信息
- 特征:
input: 类型为stringoutput: 类型为stringtext: 类型为stringinstruction: 类型为string
- 分割:
train: 字节数为 51905283,样本数为 34687
- 下载大小: 20264229 字节
- 数据集大小: 51905283 字节
配置
- 默认配置:
- 数据文件:
train: 路径为data/train-*
- 数据文件:
许可证
- MIT 许可证
任务类别
- 问答
- 对话
语言
- 英语
标签
- dolphin
- samantha
- reformatted
美观名称
- fortuna
大小类别
- 10K<n<100K



