severo/deita-6k-v0-sft
收藏Hugging Face2024-05-16 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/severo/deita-6k-v0-sft
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,包括prompt(提示)、prompt_id(提示ID)和messages(消息),其中messages包含content(内容)和role(角色)两个子特征。数据集分为四个部分:train_sft(训练集SFT)、test_sft(测试集SFT)、train_gen(训练集GEN)和test_gen(测试集GEN),每个部分都有相应的字节大小和示例数量。数据集总下载大小为232332840字节,总数据集大小为586698031字节。
该数据集包含多个特征,包括prompt(提示)、prompt_id(提示ID)和messages(消息),其中messages包含content(内容)和role(角色)两个子特征。数据集分为四个部分:train_sft(训练集SFT)、test_sft(测试集SFT)、train_gen(训练集GEN)和test_gen(测试集GEN),每个部分都有相应的字节大小和示例数量。数据集总下载大小为232332840字节,总数据集大小为586698031字节。
提供机构:
severo
原始信息汇总
数据集概述
特征信息
- prompt: 数据类型为字符串。
- prompt_id: 数据类型为字符串。
- messages: 列表类型,包含以下字段:
- content: 数据类型为字符串。
- role: 数据类型为字符串。
数据分割
- train_sft:
- 字节数: 282384543.6
- 样本数: 5700
- test_sft:
- 字节数: 14862344.4
- 样本数: 300
- train_gen:
- 字节数: 276218301
- 样本数: 5700
- test_gen:
- 字节数: 13232842
- 样本数: 300
数据大小
- 下载大小: 232332840 字节
- 数据集大小: 586698031 字节
配置信息
- default 配置包含以下数据文件路径:
- train_sft:
data/train_sft-* - test_sft:
data/test_sft-* - train_gen:
data/train_gen-* - test_gen:
data/test_gen-*
- train_sft:
标签
- not-for-all-audiences



