Hajorda/ozbom
收藏Hugging Face2026-03-26 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/Hajorda/ozbom
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: student_persona
dtype: string
- name: student_persona_structured
struct:
- name: backstory
dtype: string
- name: cognitive_level
dtype: string
- name: emotional_state
dtype: string
- name: grade
dtype: string
- name: language_quirk
dtype: string
- name: name
dtype: string
- name: personality
dtype: string
- name: scenario_type
dtype: string
- name: weak_skill
dtype: string
- name: conversations
list:
- name: from
dtype: string
- name: value
dtype: string
- name: metadata
struct:
- name: backstory_tokens
struct:
- name: input
dtype: int64
- name: output
dtype: int64
- name: cost_usd
dtype: float64
- name: dialogue_id
dtype: int64
- name: is_complete
dtype: bool
- name: last_step_reached
dtype: string
- name: model_reviewer
dtype: string
- name: model_student
dtype: string
- name: model_teacher
dtype: string
- name: timestamp
dtype: string
- name: tokens
struct:
- name: backstory_input
dtype: int64
- name: backstory_output
dtype: int64
- name: reviewer_input
dtype: int64
- name: reviewer_output
dtype: int64
- name: student_input
dtype: int64
- name: student_output
dtype: int64
- name: teacher_input
dtype: int64
- name: teacher_output
dtype: int64
- name: total_reviewer_retries
dtype: int64
- name: turn_count
dtype: int64
- name: turns
list:
- name: cached_input_tokens_teacher
dtype: int64
- name: input_tokens_reviewer
dtype: int64
- name: input_tokens_student
dtype: int64
- name: input_tokens_teacher
dtype: int64
- name: output_tokens_reviewer
dtype: int64
- name: output_tokens_student
dtype: int64
- name: output_tokens_teacher
dtype: int64
- name: reviewer_reason
dtype: string
- name: reviewer_retries
dtype: int64
- name: reviewer_valid
dtype: bool
- name: turn
dtype: int64
splits:
- name: train
num_bytes: 35319787
num_examples: 1003
download_size: 31928427
dataset_size: 35319787
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征:
- 学生人设(student_persona):字符串类型
- 结构化学生人设(student_persona_structured):结构体,包含以下字段:
- 背景故事(backstory):字符串类型
- 认知水平(cognitive_level):字符串类型
- 情绪状态(emotional_state):字符串类型
- 年级(grade):字符串类型
- 语言习惯(language_quirk):字符串类型
- 姓名(name):字符串类型
- 性格(personality):字符串类型
- 场景类型(scenario_type):字符串类型
- 薄弱技能(weak_skill):字符串类型
- 对话(conversations):列表类型,列表元素包含以下字段:
- 发言方(from):字符串类型
- 对话内容(value):字符串类型
- 元数据(metadata):结构体,包含以下字段:
- 背景故事令牌(backstory_tokens):结构体,包含以下字段:
- 输入令牌数(input):64位整型
- 输出令牌数(output):64位整型
- 花费(美元)(cost_usd):浮点型
- 对话ID(dialogue_id):64位整型
- 是否完成(is_complete):布尔型
- 到达的最后步骤(last_step_reached):字符串类型
- 审核模型(model_reviewer):字符串类型
- 学生模拟模型(model_student):字符串类型
- 教师模拟模型(model_teacher):字符串类型
- 时间戳(timestamp):字符串类型
- 令牌统计(tokens):结构体,包含以下字段:
- 背景故事输入令牌数(backstory_input):64位整型
- 背景故事输出令牌数(backstory_output):64位整型
- 审核模型输入令牌数(reviewer_input):64位整型
- 审核模型输出令牌数(reviewer_output):64位整型
- 学生模拟模型输入令牌数(student_input):64位整型
- 学生模拟模型输出令牌数(student_output):64位整型
- 教师模拟模型输入令牌数(teacher_input):64位整型
- 教师模拟模型输出令牌数(teacher_output):64位整型
- 审核模型重试总次数(total_reviewer_retries):64位整型
- 对话轮次总数(turn_count):64位整型
- 轮次信息(turns):列表类型,列表元素包含以下字段:
- 教师模型缓存输入令牌数(cached_input_tokens_teacher):64位整型
- 审核模型输入令牌数(input_tokens_reviewer):64位整型
- 学生模拟模型输入令牌数(input_tokens_student):64位整型
- 教师模拟模型输入令牌数(input_tokens_teacher):64位整型
- 审核模型输出令牌数(output_tokens_reviewer):64位整型
- 学生模拟模型输出令牌数(output_tokens_student):64位整型
- 教师模拟模型输出令牌数(output_tokens_teacher):64位整型
- 审核原因(reviewer_reason):字符串类型
- 审核模型重试次数(reviewer_retries):64位整型
- 审核结果有效(reviewer_valid):布尔型
- 轮次编号(turn):64位整型
数据集划分:
- 训练集(train):占用字节数35319787,样本量1003
下载大小:31928427
数据集占用大小:35319787
数据集配置:
- 默认配置(default):数据文件如下:
- 划分:train
- 路径:data/train-*
提供机构:
Hajorda



