dsrtrain/new_numia_prompt_dpo2
收藏Hugging Face2025-02-23 更新2025-11-01 收录
下载链接:
https://hf-mirror.com/datasets/dsrtrain/new_numia_prompt_dpo2
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: data_source
dtype: string
- name: prompt
list:
- name: content
dtype: string
- name: role
dtype: string
- name: ability
dtype: string
- name: reward_model
struct:
- name: ground_truth
dtype: string
- name: style
dtype: string
- name: extra_info
struct:
- name: index
dtype: int64
- name: split
dtype: string
- name: problem
dtype: string
splits:
- name: train
num_bytes: 19586313
num_examples: 20000
download_size: 5477936
dataset_size: 19586313
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征字段:
- 名称:data_source,数据类型:字符串型
- 名称:提示词(prompt),为列表类型,包含两个子字段:
- 名称:content,数据类型:字符串型
- 名称:role,数据类型:字符串型
- 名称:ability,数据类型:字符串型
- 名称:奖励模型(reward_model),为结构体类型,包含两个子字段:
- 名称:真实标签(ground_truth),数据类型:字符串型
- 名称:style,数据类型:字符串型
- 名称:额外信息(extra_info),为结构体类型,包含两个子字段:
- 名称:index,数据类型:64位整型
- 名称:split,数据类型:字符串型
- 名称:problem,数据类型:字符串型
数据拆分:
- 名称:train(训练集),字节数:19586313,样本数:20000
下载大小:5477936
数据集总大小:19586313
配置项:
- 配置名:default(默认配置),数据文件:
- 拆分:train(训练集),路径:data/train-*
提供机构:
dsrtrain



