five

SkillFactory-dev/Q7Bcd3argRef

收藏
Hugging Face2025-11-18 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/SkillFactory-dev/Q7Bcd3argRef
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: question dtype: string - name: answer dtype: string - name: task_config dtype: string - name: task_source dtype: string - name: prompt list: - name: content dtype: string - name: role dtype: string - name: metadata dtype: string - name: is_model_response_correct__final_answer list: string - name: is_model_response_correct__reasoning list: string - name: prompt__example_annotation__metadata struct: - name: api_url dtype: string - name: backend dtype: string - name: chat_template_applied dtype: bool - name: generation_params struct: - name: chat_template_applied dtype: bool - name: max_tokens dtype: int64 - name: n dtype: int64 - name: repetition_penalty dtype: float64 - name: temperature dtype: float64 - name: top_k dtype: int64 - name: top_p dtype: float64 - name: model_name dtype: string - name: prompt list: - name: content dtype: string - name: role dtype: string - name: model_responses__example_annotation list: string - name: model_responses__example_annotation__eval_is_correct list: bool - name: model_responses__example_annotation__eval_extracted_answers list: string - name: prompt_type dtype: string - name: reflection_prompt list: - name: content dtype: string - name: role dtype: string - name: model_responses__mutated_prompts_reflection list: string - name: model_responses__mutated_prompts_reflection__finish_reason_length_flags list: bool - name: model_responses__mutated_prompts_reflection__length_partial_responses list: string - name: reflection_prompt__mutated_prompts_reflection__metadata struct: - name: api_url dtype: string - name: backend dtype: string - name: chat_template_applied dtype: bool - name: generation_params struct: - name: chat_template_applied dtype: bool - name: max_tokens dtype: int64 - name: n dtype: int64 - name: repetition_penalty dtype: float64 - name: temperature dtype: float64 - name: top_k dtype: int64 - name: top_p dtype: float64 - name: model_name dtype: string - name: prompt list: - name: content dtype: string - name: role dtype: string - name: model_responses__mutated_prompts_reflection__metadata struct: - name: backend dtype: string - name: model_name dtype: string - name: n_responses dtype: int64 splits: - name: train num_bytes: 3021151201 num_examples: 107621 download_size: 400054085 dataset_size: 3021151201 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集信息(dataset_info): 特征字段(features): - 字段名:问题(question),数据类型(dtype):字符串(string) - 字段名:答案(answer),数据类型(dtype):字符串(string) - 字段名:任务配置(task_config),数据类型(dtype):字符串(string) - 字段名:任务来源(task_source),数据类型(dtype):字符串(string) - 字段名:提示词(prompt),为列表(list)类型,包含以下子字段: - 子字段名:内容(content),数据类型(dtype):字符串(string) - 子字段名:角色(role),数据类型(dtype):字符串(string) - 字段名:元数据(metadata),数据类型(dtype):字符串(string) - 字段名:模型响应正确性标记_最终答案(is_model_response_correct__final_answer),为字符串列表类型 - 字段名:模型响应正确性标记_推理过程(is_model_response_correct__reasoning),为字符串列表类型 - 字段名:提示词示例标注元数据(prompt__example_annotation__metadata),为结构体(struct)类型,包含以下子字段: - 子字段名:API地址(api_url),数据类型(dtype):字符串(string) - 子字段名:后端(backend),数据类型(dtype):字符串(string) - 子字段名:已应用对话模板(chat_template_applied),数据类型(dtype):布尔值(bool) - 子字段名:生成参数(generation_params),为结构体(struct)类型,包含以下子字段: - 子字段名:已应用对话模板(chat_template_applied),数据类型(dtype):布尔值(bool) - 子字段名:最大令牌数(max_tokens),数据类型(dtype):64位整数(int64) - 子字段名:生成响应数(n),数据类型(dtype):64位整数(int64) - 子字段名:重复惩罚系数(repetition_penalty),数据类型(dtype):64位浮点数(float64) - 子字段名:温度系数(temperature),数据类型(dtype):64位浮点数(float64) - 子字段名:Top-K采样数(top_k),数据类型(dtype):64位整数(int64) - 子字段名:Top-P采样阈值(top_p),数据类型(dtype):64位浮点数(float64) - 子字段名:模型名称(model_name),数据类型(dtype):字符串(string) - 子字段名:提示词(prompt),为列表(list)类型,包含内容与角色两个字符串子字段 - 字段名:示例标注的模型响应(model_responses__example_annotation),为字符串列表类型 - 字段名:示例标注模型响应的正确性评估(model_responses__example_annotation__eval_is_correct),为布尔值列表类型 - 字段名:示例标注模型响应的抽取答案(model_responses__example_annotation__eval_extracted_answers),为字符串列表类型 - 字段名:提示词类型(prompt_type),数据类型(dtype):字符串(string) - 字段名:反思提示词(reflection_prompt),为列表(list)类型,包含内容与角色两个字符串子字段 - 字段名:变异提示词反思的模型响应(model_responses__mutated_prompts_reflection),为字符串列表类型 - 字段名:变异提示词反思模型响应的终止原因长度标记(model_responses__mutated_prompts_reflection__finish_reason_length_flags),为布尔值列表类型 - 字段名:变异提示词反思模型响应的截断部分响应(model_responses__mutated_prompts_reflection__length_partial_responses),为字符串列表类型 - 字段名:反思提示词_变异提示词反思元数据(reflection_prompt__mutated_prompts_reflection__metadata),为结构体(struct)类型,字段结构与提示词示例标注元数据一致 - 字段名:变异提示词反思模型响应元数据(model_responses__mutated_prompts_reflection__metadata),为结构体(struct)类型,包含以下子字段: - 子字段名:后端(backend),数据类型(dtype):字符串(string) - 子字段名:模型名称(model_name),数据类型(dtype):字符串(string) - 子字段名:响应生成数量(n_responses),数据类型(dtype):64位整数(int64) 数据划分(splits): - 划分名称:训练集(train),占用字节数:3021151201,样本总数:107621 下载总大小(download_size):400054085字节 数据集总大小(dataset_size):3021151201字节 配置项(configs): - 配置名称:默认配置(default),数据文件配置(data_files): - 对应划分:训练集(train),文件路径:data/train-*
提供机构:
SkillFactory-dev
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作