EGE_Math_Solutions_Assessment_Benchmark
收藏EGE Math Solutions Assessment Benchmark 数据集概述
数据集基本信息
- 任务类别: 图像文本到文本 (image-text-to-text)
- 许可证: 其他 (other)
- 语言: 俄语 (ru)
- 标签: 数学 (mathematics)、教育 (education)、视觉语言模型 (vlm)、评估 (assessment)、俄语 (russian)、手写 (handwritten)
数据集描述
- 内容: 包含俄罗斯统一国家考试(EGE)数学题目的学生解答,带有参考分数,用于自动化评估系统的基准测试。
- 图像类型:
- 显示正确答案的学生解答 (152张)
- 不显示答案的学生解答 (152张)
- 每个问题的真实/参考解答 (144张)
数据集统计
- 总示例数: 122
- 总图像数: 448
- 任务类型数: 7
- 分数范围: 0-4分
任务类型分布
| 任务类型 | 数量 |
|---|---|
| 金融数学 | 15 |
| 对数不等式 | 19 |
| 数论问题 | 16 |
| 平面几何问题 | 17 |
| 参数问题 | 16 |
| 立体几何问题 | 18 |
| 三角方程 | 21 |
分数分布
| 分数 | 数量 | 百分比 |
|---|---|---|
| 0 | 28 | 23.0% |
| 1 | 40 | 32.8% |
| 2 | 35 | 28.7% |
| 3 | 11 | 9.0% |
| 4 | 8 | 6.6% |
数据集结构
每个示例包含以下字段:
solution_id: 解决方案的唯一标识符task_id: 任务类型ID (13-19)example_id: 特定示例标识符task_type: 任务类型的英文描述score: 参考分数 (0-4)parts_count: 解决方案中的部分数量images_with_answer: 包含正确答案的学生解答图像列表 (PIL Image对象)images_without_answer: 仅包含学生解答的图像列表 (PIL Image对象)images_with_true_solution: 包含真实解决方案的任务图像列表 (PIL Image对象)
使用方式
python from datasets import load_dataset
加载数据集
dataset = load_dataset(Karifannaa/EGE_Math_Solutions_Assessment_Benchmark)
访问示例
example = dataset[train][0] print(f"Solution ID: {example[solution_id]}") print(f"Task Type: {example[task_type]}") print(f"Score: {example[score]}")
查看图像 (所有图像均为PIL Image对象)
print(f"Images with answer: {len(example[images_with_answer])}") print(f"Images without answer: {len(example[images_without_answer])}") print(f"Images with true solution: {len(example[images_with_true_solution])}")
显示图像
if example[images_with_answer]: img = example[images_with_answer][0] img.show()
图像访问
所有图像均存储为PIL Image对象,可直接访问: python
获取第一个示例
example = dataset[train][0]
访问不同类型的图像
student_solution_with_answer = example[images_with_answer][0] student_solution_without_answer = example[images_without_answer][0] true_solution = example[images_with_true_solution][0]
图像为标准PIL Image对象
print(f"Image size: {student_solution_with_answer.size}") print(f"Image mode: {student_solution_with_answer.mode}")
保存图像
student_solution_with_answer.save("solution.png")
许可证
本数据集仅供研究和教育用途。
引用
Plain Text:
Khrulev, R. (2025). CHECK-MAT: Checking Hand-Written Mathematical Answers for the Russian Unified State Exam. arXiv preprint arXiv:2507.22958. https://arxiv.org/abs/2507.22958
BibTeX: bibtex @misc{khrulev2025checkmatcheckinghandwrittenmathematical, title={CHECK-MAT: Checking Hand-Written Mathematical Answers for the Russian Unified State Exam}, author={Ruslan Khrulev}, year={2025}, eprint={2507.22958}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2507.22958}, }




