five

1231czx/7B_iter2_dpo_N1_sft_data_gen_by_sft1epoch_and_dpoiter1_sft1epoch

收藏
Hugging Face2024-06-30 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/1231czx/7B_iter2_dpo_N1_sft_data_gen_by_sft1epoch_and_dpoiter1_sft1epoch
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含18000个训练样本,每个样本由messages列表组成,列表中包含content和role两个字符串类型的字段。数据集总大小为15568091字节,下载大小为6962134字节。数据文件路径在默认配置下指向train分割的数据。

This dataset contains 18,000 training samples, each consisting of a messages list that includes two string-type fields: content and role. The total size of the dataset is 15,568,091 bytes, with a download size of 6,962,134 bytes. The data file path points to the train split under the default configuration.
提供机构:
1231czx
原始信息汇总

数据集概述

数据集特征

  • messages: 包含以下子特征
    • content: 数据类型为字符串
    • role: 数据类型为字符串

数据集划分

  • train:
    • 字节数: 15568091
    • 样本数: 18000

数据集大小

  • 下载大小: 6962134 字节
  • 数据集总大小: 15568091 字节

配置信息

  • default:
    • 数据文件路径: data/train-*
二维码
社区交流群
二维码
科研交流群
商业服务