LehongWu/verl-lt-collect_V-gem3f_med-rep8_seed2400_0409-suc500-replace_cntxt
收藏Hugging Face2026-04-17 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/LehongWu/verl-lt-collect_V-gem3f_med-rep8_seed2400_0409-suc500-replace_cntxt
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: images
list: image
- name: prompt
list:
- name: content
dtype: string
- name: role
dtype: string
- name: reward_model
struct:
- name: ground_truth
dtype: string
- name: style
dtype: string
- name: extra_info
struct:
- name: answer
dtype: string
- name: completion
dtype: string
- name: think
dtype: string
- name: uuid
dtype: string
- name: goal
dtype: string
- name: task_specific_prompt
dtype: string
- name: previous_instruction
dtype: string
- name: data_source
dtype: string
- name: ability
dtype: string
- name: split
dtype: string
splits:
- name: train
num_bytes: 51339909
num_examples: 4663
download_size: 30101956
dataset_size: 51339909
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息(dataset_info):
特征列表:
1. 图像(images):图像类型列表
2. 提示词(prompt):列表结构,列表内每个元素为包含以下字段的结构体:
- 内容(content):字符串类型
- 角色(role):字符串类型
3. 奖励模型(reward_model):结构体,包含以下字段:
- 基准真值(ground_truth):字符串类型
- 风格(style):字符串类型
4. 额外信息(extra_info):结构体,包含以下字段:
- 回答(answer):字符串类型
- 补全内容(completion):字符串类型
- 思考过程(think):字符串类型
- 通用唯一识别码(UUID):字符串类型
- 目标(goal):字符串类型
- 任务专属提示词(task_specific_prompt):字符串类型
- 先前指令(previous_instruction):字符串类型
5. 数据源(data_source):字符串类型
6. 能力(ability):字符串类型
7. 划分(split):字符串类型
划分集详情:
- 名称:训练集(train),占用字节数:51339909,样本数量:4663
下载总大小:30101956,数据集总占用大小:51339909
配置信息:
- 配置名称:默认(default),数据文件配置:
- 划分:训练集(train),文件路径:data/train-*
提供机构:
LehongWu



