rickykwang/rickykwang-data-1209-rl-data
收藏Hugging Face2025-12-11 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/rickykwang/rickykwang-data-1209-rl-data
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: ability
dtype: string
- name: data_source
dtype: string
- name: env_name
dtype: string
- name: extra_info
struct:
- name: data_source
dtype: string
- name: images
sequence: image
- name: prompt
list:
- name: content
dtype: string
- name: role
dtype: string
- name: reward_model
struct:
- name: ground_truth
struct:
- name: city
dtype: string
- name: country
dtype: string
- name: gemini_remark
dtype: string
- name: province_or_state
dtype: string
- name: style
dtype: string
splits:
- name: train
num_bytes: 100730428137.0
num_examples: 12000
download_size: 65784348020
dataset_size: 100730428137.0
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征:
- 字段名:能力(ability),数据类型:字符串
- 字段名:数据来源(data_source),数据类型:字符串
- 字段名:环境名称(env_name),数据类型:字符串
- 字段名:附加信息(extra_info),为结构体类型,其子字段包括:
- 字段名:数据来源(data_source),数据类型:字符串
- 字段名:图像(images),为图像序列类型
- 字段名:提示词(prompt),为列表类型,列表元素包含两个子字段:
- 字段名:内容(content),数据类型:字符串
- 字段名:角色(role),数据类型:字符串
- 字段名:奖励模型(reward_model),为结构体类型,其子字段包括:
- 字段名:真实标签(ground_truth),为结构体类型,其子字段包括:
- 字段名:城市(city),数据类型:字符串
- 字段名:国家(country),数据类型:字符串
- 字段名:Gemini标注(gemini_remark),数据类型:字符串
- 字段名:省份/州(province_or_state),数据类型:字符串
- 字段名:风格(style),数据类型:字符串
数据集划分:
- 划分名称:训练集(train),字节占用量:100730428137.0,样本数量:12000
下载大小:65784348020
数据集总大小:100730428137.0
配置项:
- 配置名称:默认配置(default),数据文件:
- 划分集:训练集,文件路径:data/train-*
提供机构:
rickykwang



