mzio/tw-sft-treasure-hunter-easy-hi
收藏Hugging Face2026-03-23 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/mzio/tw-sft-treasure-hunter-easy-hi
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: state
list:
- name: content
dtype: string
- name: role
dtype: string
- name: action
struct:
- name: content
dtype: string
- name: role
dtype: string
- name: next_obs
list:
- name: content
dtype: string
- name: role
dtype: string
- name: done
dtype: bool
- name: reward
dtype: float64
- name: is_train
dtype: bool
- name: tools
list:
- name: description
dtype: string
- name: name
dtype: string
- name: parameters
struct:
- name: properties
struct:
- name: container
struct:
- name: description
dtype: string
- name: type
dtype: string
- name: direction
struct:
- name: description
dtype: string
- name: enum
list: string
- name: type
dtype: string
- name: item
struct:
- name: description
dtype: string
- name: type
dtype: string
- name: key
struct:
- name: description
dtype: string
- name: type
dtype: string
- name: source
struct:
- name: description
dtype: string
- name: type
dtype: string
- name: supporter
struct:
- name: description
dtype: string
- name: type
dtype: string
- name: target
struct:
- name: description
dtype: string
- name: type
dtype: string
- name: required
list: string
- name: type
dtype: string
- name: type
dtype: string
- name: system_prompt
dtype: string
- name: unique_data_sample_id
dtype: int64
- name: timestep
dtype: int64
- name: generation_id
dtype: int64
- name: return_
dtype: float64
- name: advantage
dtype: float64
- name: split
dtype: string
splits:
- name: train
num_bytes: 2011447
num_examples: 244
download_size: 1687239
dataset_size: 2011447
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征:
- 名称:state(状态)
列表类型:
- 子字段:content(内容)
数据类型:字符串
- 子字段:role(角色)
数据类型:字符串
- 名称:action(动作)
结构体类型:
- 成员:content(内容)
数据类型:字符串
- 成员:role(角色)
数据类型:字符串
- 名称:next_obs(下一观测)
列表类型:
- 子字段:content(内容)
数据类型:字符串
- 子字段:role(角色)
数据类型:字符串
- 名称:done(终止标志)
数据类型:布尔值
- 名称:reward(奖励)
数据类型:64位浮点数
- 名称:is_train(训练集标记)
数据类型:布尔值
- 名称:tools(工具)
列表类型:
- 子字段:description(描述)
数据类型:字符串
- 子字段:name(名称)
数据类型:字符串
- 子字段:parameters(参数)
结构体类型:
- 成员:properties(属性)
结构体类型:
- 成员:container(容器)
结构体类型:
- 成员:description(描述)
数据类型:字符串
- 成员:type(类型)
数据类型:字符串
- 成员:direction(方向)
结构体类型:
- 成员:description(描述)
数据类型:字符串
- 成员:enum(枚举值)
列表类型:字符串
- 成员:type(类型)
数据类型:字符串
- 成员:item(条目)
结构体类型:
- 成员:description(描述)
数据类型:字符串
- 成员:type(类型)
数据类型:字符串
- 成员:key(键)
结构体类型:
- 成员:description(描述)
数据类型:字符串
- 成员:type(类型)
数据类型:字符串
- 成员:source(来源)
结构体类型:
- 成员:description(描述)
数据类型:字符串
- 成员:type(类型)
数据类型:字符串
- 成员:supporter(支持对象)
结构体类型:
- 成员:description(描述)
数据类型:字符串
- 成员:type(类型)
数据类型:字符串
- 成员:target(目标对象)
结构体类型:
- 成员:description(描述)
数据类型:字符串
- 成员:type(类型)
数据类型:字符串
- 成员:required(必填项)
列表类型:字符串
- 成员:type(类型)
数据类型:字符串
- 子字段:type(类型)
数据类型:字符串
- 名称:system_prompt(系统提示词)
数据类型:字符串
- 名称:unique_data_sample_id(唯一数据样本ID)
数据类型:64位整数
- 名称:timestep(时间步)
数据类型:64位整数
- 名称:generation_id(生成ID)
数据类型:64位整数
- 名称:return_(累积回报)
数据类型:64位浮点数
- 名称:advantage(优势值)
数据类型:64位浮点数
- 名称:split(数据集划分)
数据类型:字符串
数据集划分:
- 划分名称:train(训练集)
字节大小:2011447
样本数量:244
下载大小:1687239
数据集总大小:2011447
配置项:
- 配置名称:default(默认配置)
数据文件:
- 划分:train(训练集)
路径:data/train-*
提供机构:
mzio



