SkillFactory-dev/Q7Bcd3argRef
收藏Hugging Face2025-11-18 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/SkillFactory-dev/Q7Bcd3argRef
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: question
dtype: string
- name: answer
dtype: string
- name: task_config
dtype: string
- name: task_source
dtype: string
- name: prompt
list:
- name: content
dtype: string
- name: role
dtype: string
- name: metadata
dtype: string
- name: is_model_response_correct__final_answer
list: string
- name: is_model_response_correct__reasoning
list: string
- name: prompt__example_annotation__metadata
struct:
- name: api_url
dtype: string
- name: backend
dtype: string
- name: chat_template_applied
dtype: bool
- name: generation_params
struct:
- name: chat_template_applied
dtype: bool
- name: max_tokens
dtype: int64
- name: n
dtype: int64
- name: repetition_penalty
dtype: float64
- name: temperature
dtype: float64
- name: top_k
dtype: int64
- name: top_p
dtype: float64
- name: model_name
dtype: string
- name: prompt
list:
- name: content
dtype: string
- name: role
dtype: string
- name: model_responses__example_annotation
list: string
- name: model_responses__example_annotation__eval_is_correct
list: bool
- name: model_responses__example_annotation__eval_extracted_answers
list: string
- name: prompt_type
dtype: string
- name: reflection_prompt
list:
- name: content
dtype: string
- name: role
dtype: string
- name: model_responses__mutated_prompts_reflection
list: string
- name: model_responses__mutated_prompts_reflection__finish_reason_length_flags
list: bool
- name: model_responses__mutated_prompts_reflection__length_partial_responses
list: string
- name: reflection_prompt__mutated_prompts_reflection__metadata
struct:
- name: api_url
dtype: string
- name: backend
dtype: string
- name: chat_template_applied
dtype: bool
- name: generation_params
struct:
- name: chat_template_applied
dtype: bool
- name: max_tokens
dtype: int64
- name: n
dtype: int64
- name: repetition_penalty
dtype: float64
- name: temperature
dtype: float64
- name: top_k
dtype: int64
- name: top_p
dtype: float64
- name: model_name
dtype: string
- name: prompt
list:
- name: content
dtype: string
- name: role
dtype: string
- name: model_responses__mutated_prompts_reflection__metadata
struct:
- name: backend
dtype: string
- name: model_name
dtype: string
- name: n_responses
dtype: int64
splits:
- name: train
num_bytes: 3021151201
num_examples: 107621
download_size: 400054085
dataset_size: 3021151201
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息(dataset_info):
特征字段(features):
- 字段名:问题(question),数据类型(dtype):字符串(string)
- 字段名:答案(answer),数据类型(dtype):字符串(string)
- 字段名:任务配置(task_config),数据类型(dtype):字符串(string)
- 字段名:任务来源(task_source),数据类型(dtype):字符串(string)
- 字段名:提示词(prompt),为列表(list)类型,包含以下子字段:
- 子字段名:内容(content),数据类型(dtype):字符串(string)
- 子字段名:角色(role),数据类型(dtype):字符串(string)
- 字段名:元数据(metadata),数据类型(dtype):字符串(string)
- 字段名:模型响应正确性标记_最终答案(is_model_response_correct__final_answer),为字符串列表类型
- 字段名:模型响应正确性标记_推理过程(is_model_response_correct__reasoning),为字符串列表类型
- 字段名:提示词示例标注元数据(prompt__example_annotation__metadata),为结构体(struct)类型,包含以下子字段:
- 子字段名:API地址(api_url),数据类型(dtype):字符串(string)
- 子字段名:后端(backend),数据类型(dtype):字符串(string)
- 子字段名:已应用对话模板(chat_template_applied),数据类型(dtype):布尔值(bool)
- 子字段名:生成参数(generation_params),为结构体(struct)类型,包含以下子字段:
- 子字段名:已应用对话模板(chat_template_applied),数据类型(dtype):布尔值(bool)
- 子字段名:最大令牌数(max_tokens),数据类型(dtype):64位整数(int64)
- 子字段名:生成响应数(n),数据类型(dtype):64位整数(int64)
- 子字段名:重复惩罚系数(repetition_penalty),数据类型(dtype):64位浮点数(float64)
- 子字段名:温度系数(temperature),数据类型(dtype):64位浮点数(float64)
- 子字段名:Top-K采样数(top_k),数据类型(dtype):64位整数(int64)
- 子字段名:Top-P采样阈值(top_p),数据类型(dtype):64位浮点数(float64)
- 子字段名:模型名称(model_name),数据类型(dtype):字符串(string)
- 子字段名:提示词(prompt),为列表(list)类型,包含内容与角色两个字符串子字段
- 字段名:示例标注的模型响应(model_responses__example_annotation),为字符串列表类型
- 字段名:示例标注模型响应的正确性评估(model_responses__example_annotation__eval_is_correct),为布尔值列表类型
- 字段名:示例标注模型响应的抽取答案(model_responses__example_annotation__eval_extracted_answers),为字符串列表类型
- 字段名:提示词类型(prompt_type),数据类型(dtype):字符串(string)
- 字段名:反思提示词(reflection_prompt),为列表(list)类型,包含内容与角色两个字符串子字段
- 字段名:变异提示词反思的模型响应(model_responses__mutated_prompts_reflection),为字符串列表类型
- 字段名:变异提示词反思模型响应的终止原因长度标记(model_responses__mutated_prompts_reflection__finish_reason_length_flags),为布尔值列表类型
- 字段名:变异提示词反思模型响应的截断部分响应(model_responses__mutated_prompts_reflection__length_partial_responses),为字符串列表类型
- 字段名:反思提示词_变异提示词反思元数据(reflection_prompt__mutated_prompts_reflection__metadata),为结构体(struct)类型,字段结构与提示词示例标注元数据一致
- 字段名:变异提示词反思模型响应元数据(model_responses__mutated_prompts_reflection__metadata),为结构体(struct)类型,包含以下子字段:
- 子字段名:后端(backend),数据类型(dtype):字符串(string)
- 子字段名:模型名称(model_name),数据类型(dtype):字符串(string)
- 子字段名:响应生成数量(n_responses),数据类型(dtype):64位整数(int64)
数据划分(splits):
- 划分名称:训练集(train),占用字节数:3021151201,样本总数:107621
下载总大小(download_size):400054085字节
数据集总大小(dataset_size):3021151201字节
配置项(configs):
- 配置名称:默认配置(default),数据文件配置(data_files):
- 对应划分:训练集(train),文件路径:data/train-*
提供机构:
SkillFactory-dev



