judged_science_completions
收藏数据集概述
基本信息
- 数据集名称: reasoning-proj/judged_science_completions
- 数据集地址: https://huggingface.co/datasets/reasoning-proj/judged_science_completions
数据集配置
数据集包含多个配置,每个配置针对不同的模型和条件:
-
j_c.dfiltered.science.DeepSeek_R1_Distill_Qwen_1.5B.madversarial.cont.wrong.reasoning.t10
- 样本数量: 231
- 数据集大小: 59,180,832 字节
- 下载大小: 20,740,453 字节
-
j_c.dfiltered.science.DeepSeek_R1_Distill_Qwen_1.5B.madversarial.cont.wrong.reasoning.t30
- 样本数量: 231
- 数据集大小: 57,204,034 字节
- 下载大小: 20,098,291 字节
-
j_c.dfiltered.science.DeepSeek_R1_Distill_Qwen_1.5B.mbenign.complete.step.t10
- 样本数量: 231
- 数据集大小: 55,428,360 字节
- 下载大小: 19,628,618 字节
-
j_c.dfiltered.science.DeepSeek_R1_Distill_Qwen_1.5B.mbenign.complete.step.t30
- 样本数量: 231
- 数据集大小: 51,080,577 字节
- 下载大小: 18,138,158 字节
-
j_c.dfiltered.science.DeepSeek_R1_Distill_Qwen_1.5B.mbenign.complete.step.t50
- 样本数量: 231
- 数据集大小: 46,465,234 字节
- 下载大小: 16,679,143 字节
-
j_c.dfiltered.science.DeepSeek_R1_Distill_Qwen_1.5B.mbenign.complete.step.t70
- 样本数量: 231
- 数据集大小: 41,819,951 字节
- 下载大小: 15,509,587 字节
-
j_c.dfiltered.science.DeepSeek_R1_Distill_Qwen_1.5B.mbenign.complete.step.t90
- 样本数量: 231
- 数据集大小: 38,165,220 字节
- 下载大小: 13,935,122 字节
-
j_c.dfiltered.science.DeepSeek_R1_Distill_Qwen_1.5B.mbenign.rewrite.trace.t10
- 样本数量: 231
- 数据集大小: 14,177,168 字节
- 下载大小: 5,641,023 字节
-
j_c.dfiltered.science.DeepSeek_R1_Distill_Qwen_1.5B.mbenign.rewrite.trace.t30
- 样本数量: 231
- 数据集大小: 14,043,491 字节
- 下载大小: 5,555,058 字节
-
j_c.dfiltered.science.DeepSeek_R1_Distill_Qwen_1.5B.mbenign.rewrite.trace.t50
- 样本数量: 231
- 数据集大小: 13,018,008 字节
- 下载大小: 5,309,919 字节
-
j_c.dfiltered.science.DeepSeek_R1_Distill_Qwen_1.5B.mbenign.rewrite.trace.t70
- 样本数量: 231
- 数据集大小: 12,301,335 字节
- 下载大小: 5,045,521 字节
-
j_c.dfiltered.science.DeepSeek_R1_Distill_Qwen_1.5B.mbenign.rewrite.trace.t90
- 样本数量: 231
- 数据集大小: 不完整(数据未提供)
- 下载大小: 不完整(数据未提供)
特征说明
所有配置包含以下特征:
- question: 字符串类型,表示问题内容。
- answer_content: 字符串类型,表示回答内容。
- reference_answer: 字符串类型,表示参考回答。
- id: 字符串类型,表示唯一标识符。
- metadata: 结构体,包含question_source字段(字符串类型)。
- model_name: 字符串类型,表示模型名称。
- verifier_score: int64类型,表示验证分数。
- mutated_answer_content: 字符串类型,表示变异的回答内容。
- continuation_1 到 continuation_8: 字符串类型,表示不同的延续内容。
- complete_answer_1 到 complete_answer_8: 字符串类型,表示完整的回答内容。
- continuation_model: 字符串类型,表示延续模型名称。
- verifier_score_1 到 verifier_score_8: int64类型,表示不同延续的验证分数。




