five

ShenaoZhang/0.001_4iters_bs256_nodpo_only4w_userresponse_dataset

收藏
Hugging Face2024-04-27 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/ShenaoZhang/0.001_4iters_bs256_nodpo_only4w_userresponse_dataset
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: prompt dtype: string - name: prompt_id dtype: string - name: messages list: - name: content dtype: string - name: role dtype: string - name: score_chosen dtype: float64 - name: score_rejected dtype: float64 - name: reference_response dtype: string - name: chosen list: - name: content dtype: string - name: role dtype: string - name: rejected list: - name: content dtype: string - name: role dtype: string - name: is_better dtype: bool splits: - name: test_prefs_1 num_bytes: 15222029 num_examples: 2000 - name: train_prefs_1 num_bytes: 75997363 num_examples: 10000 - name: test_prefs_2 num_bytes: 18857556 num_examples: 2000 - name: train_prefs_2 num_bytes: 93984817 num_examples: 10000 - name: test_prefs_3 num_bytes: 16287791 num_examples: 2000 - name: train_prefs_3 num_bytes: 82524907 num_examples: 10000 - name: test_prefs_4 num_bytes: 17568269 num_examples: 2000 - name: train_prefs_4 num_bytes: 87962448 num_examples: 10000 download_size: 218238878 dataset_size: 408405180 configs: - config_name: default data_files: - split: test_prefs_1 path: data/test_prefs_1-* - split: train_prefs_1 path: data/train_prefs_1-* - split: test_prefs_2 path: data/test_prefs_2-* - split: train_prefs_2 path: data/train_prefs_2-* - split: test_prefs_3 path: data/test_prefs_3-* - split: train_prefs_3 path: data/train_prefs_3-* - split: test_prefs_4 path: data/test_prefs_4-* - split: train_prefs_4 path: data/train_prefs_4-* --- # Dataset Card for "0.001_4iters_bs256_nodpo_only4w_userresponse_dataset" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
ShenaoZhang
原始信息汇总

数据集概述

数据集名称

  • 名称: 0.001_4iters_bs256_nodpo_only4w_userresponse_dataset

数据集特征

  • prompt: 字符串类型
  • prompt_id: 字符串类型
  • messages: 列表类型,包含以下子特征:
    • content: 字符串类型
    • role: 字符串类型
  • score_chosen: 浮点数类型(float64)
  • score_rejected: 浮点数类型(float64)
  • reference_response: 字符串类型
  • chosen: 列表类型,包含以下子特征:
    • content: 字符串类型
    • role: 字符串类型
  • rejected: 列表类型,包含以下子特征:
    • content: 字符串类型
    • role: 字符串类型
  • is_better: 布尔类型

数据集分割

  • test_prefs_1:
    • num_bytes: 15222029
    • num_examples: 2000
  • train_prefs_1:
    • num_bytes: 75997363
    • num_examples: 10000
  • test_prefs_2:
    • num_bytes: 18857556
    • num_examples: 2000
  • train_prefs_2:
    • num_bytes: 93984817
    • num_examples: 10000
  • test_prefs_3:
    • num_bytes: 16287791
    • num_examples: 2000
  • train_prefs_3:
    • num_bytes: 82524907
    • num_examples: 10000
  • test_prefs_4:
    • num_bytes: 17568269
    • num_examples: 2000
  • train_prefs_4:
    • num_bytes: 87962448
    • num_examples: 10000

数据集大小

  • download_size: 218238878
  • dataset_size: 408405180
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个用于偏好学习或对话模型训练的中等规模数据集,包含48,000行数据,总大小为218 MB,格式为Parquet。数据样本显示其包含用户提示、响应消息、评分(chosen和rejected的分数)以及偏好标签(如is_bool),适用于训练模型区分优选和拒绝响应。数据集具有多个子集分割,支持训练和测试任务。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务