jihuny/llama_hh_10k_armo_s002_dpo_newton

Name: jihuny/llama_hh_10k_armo_s002_dpo_newton
Creator: jihuny
Published: 2026-03-28 01:41:31
License: 暂无描述

Hugging Face2026-03-28 更新2026-03-29 收录

下载链接：

https://hf-mirror.com/datasets/jihuny/llama_hh_10k_armo_s002_dpo_newton

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: prompt dtype: string - name: chosen dtype: string - name: rejected dtype: string - name: score_chosen dtype: float64 - name: score_rejected dtype: float64 - name: reward_margin dtype: float64 splits: - name: train num_bytes: 28761397 num_examples: 10000 download_size: 16097650 dataset_size: 28761397 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集信息：特征项： - 提示词（prompt）：字符串类型 - 优选回复（chosen）：字符串类型 - 弃选回复（rejected）：字符串类型 - 优选得分（score_chosen）：64位浮点型（float64） - 弃选得分（score_rejected）：64位浮点型（float64） - 奖励边际（reward_margin）：64位浮点型（float64）数据集划分： - 训练集（train）：数据字节数28761397，样本数量10000 下载总大小：16097650字节，数据集实际总大小：28761397字节数据集配置： - 默认配置（default）：数据文件对应训练集，路径为data/train-*

提供机构：

jihuny