Education_Expenditure_Trends|教育支出数据集|全球趋势数据集
收藏Education_Expenditure_Trends 数据集概述
数据集概览
- 指标: 政府教育支出占GDP的百分比。
- 来源: World Bank
- 时间跨度: 各国不同,涵盖多个年代。
- 地理覆盖范围: 全球。
关键问题探索
- 哪些国家在教育上分配的GDP百分比最高?
- 不同地区的教育支出随时间如何变化?
- 教育支出与经济指标(如人均GDP)之间是否存在相关性?
潜在应用
- 趋势分析: 研究数十年间教育支出的变化。
- 跨国比较: 识别教育投资的不平等。
- 相关性研究: 分析教育支出与识字率、GDP增长或学校入学率之间的关系。
示例可视化
- 按地区的教育支出热图。
- 显示教育支出随时间变化趋势的折线图。
- 支出与识字率相关的散点图。
分析工具
- Python库:
pandas
,matplotlib
,seaborn
,plotly
- Jupyter Notebook 用于探索性数据分析(EDA)。

Wind Turbine Data
该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。
www.kaggle.com 收录
中国1km分辨率逐月平均气温数据集(1901-2024)
该数据为中国逐月平均温度数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2024.12。数据格式为NETCDF,即.nc格式。数据单位为0.1 ℃。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。
国家青藏高原科学数据中心 收录
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
CTooth
CTooth是首个开放源代码的3D牙科CT数据集,包含完整的牙齿标注。该数据集由杭州电子科技大学等机构创建,旨在为计算机辅助牙科诊断和治疗提供支持。数据集包含5504个标注的CBCT图像,来自22名患者,涵盖了牙齿位置、数量、修复、植入物和颌骨大小等结构变异。CTooth数据集的创建过程涉及使用ITKSNAP软件手动标注牙齿区域,并经过精细调整,整个过程耗时约10个月。该数据集主要应用于3D牙齿分割研究,解决手动标注主观性和耗时性的问题。
arXiv 收录
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录