1231czx/7B_iter2_dpo_N1_sft_data_gen_by_sft1epoch_and_dpoiter1_sft1epoch
收藏Hugging Face2024-06-30 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/1231czx/7B_iter2_dpo_N1_sft_data_gen_by_sft1epoch_and_dpoiter1_sft1epoch
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含18000个训练样本,每个样本由messages列表组成,列表中包含content和role两个字符串类型的字段。数据集总大小为15568091字节,下载大小为6962134字节。数据文件路径在默认配置下指向train分割的数据。
This dataset contains 18,000 training samples, each consisting of a messages list that includes two string-type fields: content and role. The total size of the dataset is 15,568,091 bytes, with a download size of 6,962,134 bytes. The data file path points to the train split under the default configuration.
提供机构:
1231czx
原始信息汇总
数据集概述
数据集特征
- messages: 包含以下子特征
- content: 数据类型为字符串
- role: 数据类型为字符串
数据集划分
- train:
- 字节数: 15568091
- 样本数: 18000
数据集大小
- 下载大小: 6962134 字节
- 数据集总大小: 15568091 字节
配置信息
- default:
- 数据文件路径:
data/train-*
- 数据文件路径:



