690万道中文多学科试题文本结构化解析处理数据
收藏魔搭社区2026-05-14 更新2026-01-03 收录
下载链接:
https://modelscope.cn/datasets/DatatangBeijing/6.9million_Chinese_Multi_disciplinary_Questions_Text_Parsing_And_Processing_Data
下载链接
链接失效反馈官方服务:
资源简介:
690万道中文多学科试题文本结构化解析处理数据,包含小学、初中、高中、大学的多个学科。每道试题包含问题、答案、解析、题型、学科、学段等字段。该数据可用于大模型学科知识增强任务。
6.9 million structured, parsed and processed Chinese multi-disciplinary examination question text dataset, covering multiple subjects across primary school, junior high school, senior high school and university educational stages. Each question in the dataset includes fields such as question text, answer, detailed analysis, question type, subject and educational stage. This dataset can be used for subject knowledge enhancement tasks of large language models (LLMs).
提供机构:
maas
创建时间:
2025-12-23
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含约690万道中文多学科试题的结构化解析与处理数据,覆盖从小学到大学的多个学科,每道题均提供问题、答案、解释、题型、学科和教育水平等字段。数据经过解析、公式转换和清理,以Jsonl格式存储,适用于大语言模型的学科知识增强任务。
以上内容由遇见数据集搜集并总结生成



