MatrixStudio/Codeforces-Python-Submissions-RL
收藏Hugging Face2024-04-19 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/MatrixStudio/Codeforces-Python-Submissions-RL
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含编程竞赛中的问题和解决方案的详细信息,如竞赛ID、问题索引、名称、类型、难度评级、标签、标题、时间限制、内存限制、问题描述、输入输出规范、示例输入输出、注释、分数、测试用例、创建时间、相对时间、编程语言、判决结果、测试集、通过测试数、时间消耗、内存消耗、代码、提示、响应、分数和拒绝状态。数据集分为训练集和测试集,分别包含37006和4380个示例。
该数据集包含编程竞赛中的问题和解决方案的详细信息,如竞赛ID、问题索引、名称、类型、难度评级、标签、标题、时间限制、内存限制、问题描述、输入输出规范、示例输入输出、注释、分数、测试用例、创建时间、相对时间、编程语言、判决结果、测试集、通过测试数、时间消耗、内存消耗、代码、提示、响应、分数和拒绝状态。数据集分为训练集和测试集,分别包含37006和4380个示例。
提供机构:
MatrixStudio
原始信息汇总
数据集概述
特征信息
数据集包含以下特征:
- contestId: 类型为
int64 - index: 类型为
string - name: 类型为
string - type: 类型为
string - rating: 类型为
int64 - tags: 类型为
sequence的string - title: 类型为
string - time-limit: 类型为
string - memory-limit: 类型为
string - problem-description: 类型为
string - input-specification: 类型为
string - output-specification: 类型为
string - demo-input: 类型为
sequence的string - demo-output: 类型为
sequence的string - note: 类型为
string - points: 类型为
float64 - test_cases: 类型为
list,包含以下子特征:- input: 类型为
string - output: 类型为
string
- input: 类型为
- creationTimeSeconds: 类型为
int64 - relativeTimeSeconds: 类型为
int64 - programmingLanguage: 类型为
string - verdict: 类型为
string - testset: 类型为
string - passedTestCount: 类型为
int64 - timeConsumedMillis: 类型为
int64 - memoryConsumedBytes: 类型为
int64 - code: 类型为
string - prompt: 类型为
string - response: 类型为
sequence的string - score: 类型为
float64 - reject: 类型为
string
数据分割
数据集分为以下几个部分:
- train: 包含 37006 个样本,占用 265617419.65106565 字节
- test: 包含 4380 个样本,占用 30874997.475061323 字节
数据大小
- 下载大小: 26765217 字节
- 数据集大小: 296492417.12612695 字节
配置信息
- default 配置包含以下数据文件:
- train: 路径为
data/train-* - test: 路径为
data/test-*
- train: 路径为



