stratos-verified-mix-scaled-0.125

Hugging Face2025-01-30 更新2025-02-10 收录

下载链接：

https://huggingface.co/datasets/mlfoundations-dev/stratos-verified-mix-scaled-0.125

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多个特征字段，涵盖了问题、推理、解决方案、正确性判断、对话、问题ID、名称、测试用例、难度、语言、来源、解决方案数量、起始代码、子集、正确性、原因、领域、主题、子主题、ID、答案和原始行索引等信息。数据集分为训练集，包含14003个样本，总大小为1079035202.2081757字节。

创建时间：

2025-01-29

原始信息汇总

数据集概述

数据集名称

Stratos Verified Mix Scaled 0.125

数据集特征

problem: 字符串类型
reasoning: 字符串类型
deepseek_solution: 字符串类型
ground_truth_solution: 字符串类型
correct: 布尔类型
judge_reasoning: 字符串类型
system: 字符串类型
conversations: 列表类型，包含字段：
- from: 字符串类型
- value: 字符串类型
problem_id: 字符串类型
name: 字符串类型
test_cases: 字符串类型
difficulty: 字符串类型
language: 序列字符串类型
source: 字符串类型
num_solutions: 整数类型
starter_code: 字符串类型
subset: 字符串类型
correctness: 布尔类型
reason: 字符串类型
domain: 字符串类型
topic: 字符串类型
sub_topic: 字符串类型
id: 空类型
answer: 空类型
__original_row_idx: 整数类型

数据集划分

训练集：
- 文件大小：1,079,035,202.21 字节
- 示例数量：14,003

下载与大小

下载大小：543,174,245 字节
数据集总大小：1,079,035,202.21 字节

配置

默认配置：
- 数据文件：
  - 分割：训练集
  - 路径：data/train-*

搜集汇总

数据集介绍

构建方式

Stratos-Verified-Mix-Scaled-0.125数据集的构建采用了一种混合并按比例缩放的方法，旨在通过整合多样化的编程问题及其相关信息，为研究者提供一个全面的编程问题解决数据资源。数据集涵盖了问题的描述、推理过程、解决方案、正确性判断以及对话信息等维度，确保了数据的丰富性和多维性。

使用方法

使用Stratos-Verified-Mix-Scaled-0.125数据集时，用户可以根据具体的研究需求选择训练集。数据集以CSV格式存储，可以通过标准的数据处理库进行读取。用户可以依据问题ID或领域对数据集进行子集划分，以便于进行特定问题的深入分析或模型训练。

背景与挑战

背景概述

Stratos-Verified-Mix-Scaled-0.125数据集，是在计算机程序设计竞赛与代码评估领域的一项重要成果，由专业研究团队于近年开发。该数据集以编程问题为核心，涵盖了问题陈述、解题思路、参考解决方案等多个维度，旨在为自动代码评估系统提供基准测试。其主要研究人员或机构通过该数据集，对程序设计竞赛中的问题进行深入分析，并探索有效的代码质量评估方法，对相关领域产生了显著影响。

当前挑战

在构建Stratos-Verified-Mix-Scaled-0.125数据集的过程中，研究人员面临了诸多挑战。首先，如何保证所选取的问题具有代表性，并能全面覆盖不同的编程知识点，是一大难题。其次，数据集在构建过程中必须确保标注的准确性，避免引入错误。此外，数据集的规模与多样性也是挑战之一，需要在有限的资源下平衡数据集的大小与覆盖范围。在研究领域问题方面，该数据集旨在解决自动代码评估中的准确性和效率问题，这对于提高编程教育质量和促进人工智能技术在教育领域的应用具有重要价值。

常用场景

经典使用场景

在程序设计竞赛与算法研究领域，'stratos-verified-mix-scaled-0.125'数据集被广泛用于评估程序的正确性及优化算法的推理能力。该数据集包含多个编程问题，以及针对这些问题的多种解决方案和验证结果，为研究者提供了一个全面的问题解析与方案验证的平台。

解决学术问题

该数据集解决了如何有效评估算法性能，尤其是对于问题解决过程的推理能力评估。它通过提供标准答案和多种不同的解题方案，帮助学者们在学术研究中分析算法的正确性、效率及创新性，进而推动程序设计竞赛和算法研究领域的发展。

实际应用

在实际应用中，该数据集可被用于教育培训领域，作为编程课程的教学辅助工具，帮助学生理解编程问题的多样性及其解决策略。同时，它也为算法工程师提供了一种评估和改进算法性能的可靠方式。

数据集最近研究