CS Education:Open Results from a Survey of More Than 18,000Participants
收藏arXiv2025-08-07 更新2025-08-09 收录
下载链接:
https://zenodo.org/records/16754164
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由JetBrains Research创建,包含来自173个国家的18032名参与者的调查结果。数据集涵盖了计算机科学教育的各个方面,包括正式教育、学习格式、人工智能的使用、学习挑战、动机等。数据集旨在支持进一步的研究,促进计算机科学教育领域的进步。
This dataset was created by JetBrains Research, comprising survey results from 18,032 participants across 173 countries. It covers various aspects of computer science education, including formal education, learning formats, AI usage, learning challenges, motivation, and more. This dataset is intended to support further research and advance the field of computer science education.
提供机构:
JetBrains Research
创建时间:
2025-08-07
搜集汇总
数据集介绍

构建方式
该数据集的构建基于一项大规模的国际调查,覆盖了来自173个国家的18,032名参与者。调查设计包含87个问题,分为10个主要类别,涵盖计算机科学教育的多个维度,如正式教育背景、学习形式、AI工具使用、学习挑战及动机等。为确保数据的多样性和代表性,调查通过社交媒体平台和专业的调查面板进行推广,并采用多语言策略以吸引全球范围内的受访者。数据处理阶段包括严格的逻辑检查和权重调整,以纠正潜在的样本偏差,确保结果的可靠性和普适性。
特点
该数据集以其广泛的覆盖范围和深度的问题设计脱颖而出,提供了计算机科学教育领域的全面视角。其特点包括:多维度的问题设计,涵盖从传统教育形式到新兴技术如AI的应用;全球化的样本分布,确保不同文化和教育背景的视角;以及严格的隐私保护措施,确保参与者数据的匿名性和安全性。此外,数据集还包含开放性问题的手动分类结果,为研究者提供了丰富的定性分析材料。
使用方法
该数据集适用于广泛的计算机科学教育研究,包括学习动机分析、教育技术评估和跨文化教育比较。研究者可通过分析数据集中的定量和定性回答,探索不同学习形式的效果、AI在教育中的应用模式或学习挑战的普遍性。数据集的结构化设计和详细的元数据说明,便于进行高级统计分析和机器学习模型的训练。此外,数据集中的权重信息可用于调整分析结果,以更准确地反映全球计算机科学学习者的整体情况。
背景与挑战
背景概述
计算机科学教育作为一个快速发展的领域,其复杂性和多样性促使研究者不断寻求更全面的数据支持。2025年,由JetBrains Research的多位研究人员(包括Katsiaryna Dzialets、Anna Potriasaeva等)主导,创建了名为“CS Education: Open Results from a Survey of More Than 18,000 Participants”的大规模数据集。该数据集基于对来自173个国家的18,032名学习者的调查,覆盖了正式教育、学习形式、AI使用、学习挑战与动机等10个核心主题。这一数据集的发布填补了现有研究中地域覆盖不足、样本量有限以及新兴趋势(如AI教育工具)数据缺失的空白,为计算机科学教育研究提供了宝贵的全球视角。
当前挑战
该数据集在解决计算机科学教育领域的核心问题时面临多重挑战。首先,领域问题的复杂性体现在如何平衡广泛主题(如AI工具使用与传统教学方法)与深度分析的矛盾,需确保数据既能反映宏观趋势,又能支持具体教学场景的改进。其次,数据构建过程中,研究者需克服样本偏差(如部分国家参与度低)、多语言问卷的语义一致性,以及开放性问题的人工标注与隐私保护之间的冲突。此外,新兴技术(如IDE内学习)的快速迭代要求数据具备动态更新能力,而大规模样本的清洗与加权处理(如校准国家/工具使用分布)进一步增加了方法论的复杂度。
常用场景
经典使用场景
在计算机科学教育领域,这一数据集通过覆盖全球173个国家、18,032名学习者的多样化样本,为研究者提供了前所未有的宏观视角。其经典使用场景体现在跨文化、跨地域的对比研究中,例如分析不同国家学习者在AI工具采用率、学习动机或课程辍学原因上的差异。数据集特别适用于探究新兴教育模式(如IDE内学习)与传统大学教育的效能对比,以及生成式AI对编程教育的影响这类前沿议题。
解决学术问题
该数据集有效解决了计算机教育研究中样本单一性和时效性不足的核心问题。通过涵盖10大主题87个问题的结构化数据,研究者能够验证诸如“抽象概念理解障碍是否具有跨文化普遍性”或“IDE学习环境如何缓解文档缺失痛点”等假设。其加权处理后的代表性样本,尤其弥补了既往研究对发展中国家、女性学习者等群体覆盖不足的缺陷,为教育公平性研究提供了实证基础。
衍生相关工作
该数据集已催生多项标志性研究,包括JetBrains团队基于IDE学习行为提出的分层提示系统(Birillo et al., 2024),以及跨文化视角下AI工具接受度研究(Valova et al., 2024)。其开放性问题编码框架更成为后续教育调查的范本,如ACM全球教育会议2026年开展的编程挫败感跨国追踪研究便直接沿用了该数据集的分类体系。
以上内容由遇见数据集搜集并总结生成



