PISA - Programme for International Student Assessment|教育评估数据集|国际比较数据集

www.oecd.org2024-10-26 收录

教育评估

国际比较

下载链接：

http://www.oecd.org/pisa/

下载链接

链接失效反馈

资源简介：

PISA（Programme for International Student Assessment）是由经济合作与发展组织（OECD）进行的国际学生评估项目，旨在评估15岁学生在阅读、数学和科学方面的知识和技能。数据集包含来自多个国家和地区的学生的测试结果、背景信息和学校数据。

提供机构：

www.oecd.org

AI搜集汇总

数据集介绍

构建方式

PISA数据集的构建基于国际学生评估计划（Programme for International Student Assessment），该计划由经济合作与发展组织（OECD）发起，旨在评估全球范围内15岁学生的数学、科学和阅读能力。数据收集过程严格遵循多阶段抽样设计，确保样本的代表性和广泛性。通过标准化测试和问卷调查，PISA不仅收集学生的学业成绩，还涵盖了家庭背景、学校环境等多维度信息，以全面反映学生的综合素质。

特点

PISA数据集的显著特点在于其国际性和综合性。首先，该数据集覆盖了全球多个国家和地区，提供了跨文化比较的宝贵数据。其次，PISA不仅关注学生的学术表现，还深入探讨了影响学生成绩的多种因素，如社会经济背景、教育政策等。此外，PISA数据集的更新频率较高，每三年进行一次大规模评估，确保数据的时效性和连续性。

使用方法

PISA数据集的使用方法多样，适用于教育研究、政策制定和国际比较等多个领域。研究者可以通过分析PISA数据，探讨不同教育政策对学生成绩的影响，或比较不同国家和地区的教育质量。政策制定者则可以利用PISA数据，识别教育系统的优势和不足，制定针对性的改进措施。此外，PISA数据集还支持跨学科研究，如结合社会学、经济学等视角，深入分析教育与社会发展的关系。

背景与挑战

背景概述

PISA（Programme for International Student Assessment）是由经济合作与发展组织（OECD）发起的一项国际学生评估项目，旨在评估15岁学生在阅读、数学和科学方面的知识和技能。自2000年首次实施以来，PISA已成为全球教育政策制定者和研究人员的重要工具，提供了关于不同国家和地区教育系统绩效的详细数据。PISA的核心研究问题包括学生在这些关键学科中的表现、影响学生成绩的因素以及教育系统如何促进或阻碍学生的学习。PISA的影响力不仅限于学术界，还对各国的教育政策和实践产生了深远的影响。

当前挑战

PISA数据集在解决教育评估和政策制定领域的挑战方面发挥了重要作用，但也面临诸多挑战。首先，数据收集和处理过程中涉及的复杂性和多样性，如不同文化背景下的教育实践差异，增加了数据分析的难度。其次，PISA数据的高维度和大规模特性要求先进的统计和机器学习技术来有效提取有意义的见解。此外，确保数据质量和隐私保护，特别是在涉及学生个人信息时，是一个持续的挑战。最后，如何将PISA的发现转化为实际的教育改革措施，以提高教育质量和公平性，是政策制定者和研究人员面临的另一重大挑战。

发展历史

创建时间与更新

PISA（Programme for International Student Assessment）数据集由经济合作与发展组织（OECD）于2000年首次创建，旨在评估全球15岁学生的数学、科学和阅读能力。该数据集每三年更新一次，最新版本为2018年发布。

重要里程碑

PISA数据集的重要里程碑包括2000年的首次发布，标志着国际教育评估的新纪元。2003年，PISA引入了科学素养评估，进一步扩展了其评估范围。2009年，PISA首次发布了中国上海地区的评估结果，引起了全球教育界的广泛关注。2012年，PISA增加了对金融素养的评估，反映了教育评估领域的多元化发展。

当前发展情况

当前，PISA数据集已成为全球教育政策制定和学术研究的重要参考。其数据不仅用于比较各国教育系统的优劣，还为教育改革提供了实证依据。PISA的持续更新和扩展，如2018年引入的全球胜任力评估，进一步丰富了其内容和应用领域。PISA的影响力已超越教育领域，对社会经济发展和国际竞争力研究也产生了深远影响。

发展历程

PISA项目由经济合作与发展组织（OECD）首次提出，旨在评估全球范围内15岁学生的阅读、数学和科学素养。
1997年
PISA首次正式实施，共有32个国家和地区参与，标志着国际学生评估体系的重要里程碑。
2000年
PISA 2003年评估结果发布，首次引入问题解决能力作为评估维度，进一步丰富了评估内容。
2003年
PISA 2006年评估中，科学素养成为主要评估领域，强调科学教育的重要性。
2006年
PISA 2009年评估中，阅读素养再次成为主要评估领域，同时增加了对学生学习策略的考察。
2009年
PISA 2012年评估中，数学素养成为主要评估领域，同时引入了对学生合作解决问题能力的考察。
2012年
PISA 2015年评估中，科学素养再次成为主要评估领域，同时增加了对学生全球胜任力的考察。
2015年
PISA 2018年评估中，阅读素养再次成为主要评估领域，同时引入了对学生数字素养的考察。
2018年

常用场景

经典使用场景

在国际教育评估领域，PISA数据集以其广泛的覆盖面和深入的分析能力，成为衡量全球学生学业成就的重要工具。该数据集通过收集来自不同国家和地区的学生的数学、科学和阅读能力数据，为教育政策制定者提供了宝贵的参考。通过对比不同国家和地区的教育成果，PISA数据集揭示了教育系统中的优势和不足，从而推动了全球教育改革和优化。

解决学术问题

PISA数据集解决了多个学术研究中的关键问题，特别是在教育公平性和教育质量评估方面。通过分析不同社会经济背景、性别和文化背景下的学生表现，研究者能够识别出影响学生学业成就的关键因素。这不仅有助于学术界深入理解教育系统的复杂性，还为政策制定者提供了科学依据，以制定更加公平和有效的教育政策。

衍生相关工作

PISA数据集的广泛应用催生了大量相关的经典研究工作。例如，许多学者利用PISA数据进行跨国比较研究，探讨不同教育系统对学生学业成就的影响。此外，PISA数据还被用于开发新的教育评估模型和方法，推动了教育测量和评估领域的创新。这些研究不仅丰富了教育科学的理论体系，也为实际教育政策的制定提供了坚实的科学基础。

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4099个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

中国区域地面气象要素驱动数据集 v2.0（1951-2024）

中国区域地面气象要素驱动数据集（China Meteorological Forcing Data，以下简称 CMFD）是为支撑中国区域陆面、水文、生态等领域研究而研发的一套高精度、高分辨率、长时间序列数据产品。本页面发布的 CMFD 2.0 包含了近地面气温、气压、比湿、全风速、向下短波辐射通量、向下长波辐射通量、降水率等气象要素，时间分辨率为 3 小时，水平空间分辨率为 0.1°，时间长度为 74 年（1951~2024 年），覆盖了 70°E~140°E，15°N~55°N 空间范围内的陆地区域。CMFD 2.0 融合了欧洲中期天气预报中心 ERA5 再分析数据与气象台站观测数据，并在辐射、降水数据产品中集成了采用人工智能技术制作的 ISCCP-ITP-CNN 和 TPHiPr 数据产品，其数据精度较 CMFD 的上一代产品有显著提升。 CMFD 历经十余年的发展，其间发布了多个重要版本。2019 年发布的 CMFD 1.6 是完全采用传统数据融合技术制作的最后一个 CMFD 版本，而本次发布的 CMFD 2.0 则是 CMFD 转向人工智能技术制作的首个版本。此版本与 1.6 版具有相同的时空分辨率和基础变量集，但在其它诸多方面存在大幅改进。除集成了采用人工智能技术制作的辐射和降水数据外，在制作 CMFD 2.0 的过程中，研发团队尽可能采用单一来源的再分析数据作为输入并引入气象台站迁址信息，显著缓解了 CMFD 1.6 中因多源数据拼接和气象台站迁址而产生的虚假气候突变。同时，CMFD 2.0 数据的时间长度从 CMFD 1.6 的 40 年大幅扩展到了 74 年，并将继续向后延伸。CMFD 2.0 的网格空间范围虽然与 CMFD 1.6 相同，但其有效数据扩展到了中国之外，能够更好地支持跨境区域研究。为方便用户使用，CMFD 2.0 还在基础变量集之外提供了若干衍生变量，包括近地面相对湿度、雨雪分离降水产品等。此外，CMFD 2.0 摒弃了 CMFD 1.6 中通过 scale_factor 和 add_offset 参数将实型数据化为整型数据的压缩技术，转而直接将实型数据压缩存储于 NetCDF4 格式文件中，从而消除了用户使用数据时进行解压换算的困扰。本数据集原定版本号为 1.7，但鉴于本数据集从输入数据到研制技术都较上一代数据产品有了大幅的改变，故将其版本号重新定义为 2.0。CMFD 2.0 的数据内容与此前宣传的 CMFD 1.7 基本一致，仅对 1983 年 7 月以后的向下短/长波辐射通量数据进行了更新，以修正其长期趋势存在的问题。

国家青藏高原科学数据中心收录

URPC系列数据集, S-URPC2019, UDD

URPC系列数据集包括URPC2017至URPC2020DL，主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。

github 收录

CHARLS

中国健康与养老追踪调查（CHARLS）数据集，旨在收集反映中国45岁及以上中老年人家庭和个人的高质量微观数据，用以分析人口老龄化问题，内容包括健康状况、经济状况、家庭结构和社会支持等。

charls.pku.edu.cn 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录

中国陆域及周边逐日1km全天候地表温度数据集（TRIMS LST；2000-2024）

地表温度（Land surface temperature, LST）是地球表面与大气之间界面的重要参量之一。它既是地表与大气能量交互作用的直接体现，又对于地气过程具有复杂的反馈作用。因此，地表温度不仅是气候变化的敏感指示因子和掌握气候变化规律的重要前提，还是众多模型的直接输入参数，在许多领域有广泛的应用，如气象气候、环境生态、水文等。伴随地学及相关领域研究的深入和精细化，学术界对卫星遥感的全天候地表温度（All-weather LST）具有迫切的需求。本数据集的制备方法是增强型的卫星热红外遥感-再分析数据集成方法。方法的主要输入数据为Terra/Aqua MODIS LST产品和GLDAS等数据，辅助数据包括卫星遥感提供的植被指数、地表反照率等。方法充分利用了卫星热红外遥感和再分析数据提供的地表温度高频分量、低频分量以及地表温度的空间相关性，最终重建得到较高质量的全天候地表温度数据集。评价结果表明，本数据集具有良好的图像质量和精度，不仅在空间上无缝，还与当前学术界广泛采用的逐日1 km Terra/Aqua MODIS LST产品在幅值和空间分布上具有较高的一致性。当以MODIS LST为参考时，该数据集在白天和夜间的平均偏差（MBE）为0.09K和-0.03K，偏差标准差（STD）为1.45K和1.17K。基于19个站点实测数据的检验结果表明，其MBE为-2.26K至1.73K，RMSE为0.80K至3.68K，且在晴空与非晴空条件下无显著区别。本数据集的时间分辨率为逐日4次，空间分辨率为1km，时间跨度为2000年-2024年；空间范围包括我国陆域的主要区域（包含港澳台地区，暂不包含我国南海诸岛）及周边区域（72°E-135°E，19°N-55°N）。本数据集的缩写名为TRIMS LST（Thermal and Reanalysis Integrating Moderate-resolution Spatial-seamless LST），以便用户使用。需要说明的是，TRIMS LST的空间子集TRIMS LST-TP（中国西部逐日1 km全天候地表温度数据集（TRIMS LST-TP；2000-2024）V2）同步在国家青藏高原科学数据中心发布，以减少相关用户数据下载和处理的工作量。

国家青藏高原科学数据中心收录