teaching_datasets
收藏github2023-12-15 更新2024-05-31 收录
下载链接:
https://github.com/OxfordIHTM/teaching_datasets
下载链接
链接失效反馈官方服务:
资源简介:
本仓库包含一系列教学用数据集,适用于教授R语言。虽然此仓库特别为开放可重复科学在R讲座系列创建,但通过此仓库提供的数据对任何人开放,并根据Creative Commons 1.0 Universal (CC0)许可证分发。
This repository contains a collection of teaching datasets intended for teaching the R programming language. While this repository was specifically created for the Open Reproducible Science in R lecture series, the data provided through this repository is accessible to anyone and distributed under the Creative Commons 1.0 Universal (CC0) license.
创建时间:
2023-01-19
原始信息汇总
数据集概述
本数据集包含多个用于教学的子数据集,适用于教授R语言及相关的统计分析方法。以下是各数据集的详细信息:
| 文件名 | 文件类型 | 文件描述 | 适用领域/统计方法 |
|---|---|---|---|
| ba.dat | DAT | 来自Bland JM和Altman DG的研究,用于比较两种临床测量方法的统计方法。 | 比较诊断测试的统计方法,使用Bland-Altman方法和图表。 |
| bateman.dat | DAT | 1990年4月21日Jean Bateman家中的午餐聚会后发生的胃肠道疾病爆发数据。 | 用于学习和实践逻辑回归分析。 |
| ca.dat | DAT | 两组不同治疗方式的癌症患者生存数据。 | 用于学习和实践生存分析。 |
| cover.dat | DAT | 2003年3月在马拉维中部进行的营养喂养计划覆盖率调查数据。 | 用于学习和实践调查数据分析和基本空间分析。 |
| diets.dat | DAT | 索马里成人营养治疗中心进行的两种不同饮食试验数据。 | 用于学习和实践统计测试,比较两组均值差异。 |
| fem.dat | DAT | 来自118名女性精神病患者的研究数据。 | 用于学习和实践各种统计测试,线性回归,逻辑回归和线性建模。 |
| fem.xlsx | XLSX | 来自118名女性精神病患者的研究数据。 | 用于学习和实践各种统计测试,线性回归,逻辑回归和线性建模。 |
| gudhiv.dat | DAT | 冈比亚一家门诊诊所1988年8月至1990年6月间435名患有性传播感染的男性患者数据。 | 用于学习和实践逻辑回归分析。 |
| koko_plus_coverage.csv | CSV | 加纳东部Koko+覆盖率调查数据。 | 用于学习和实践调查数据分析,基本空间分析和项目绩效评估的比较分析。 |
| malaria.dat | DAT | 埃塞俄比亚一个行政区1997年7月至1999年7月的降雨量和疟疾病例报告数据。 | 用于学习和实践时间序列分析和绘图。 |
| nut.dat | DAT | 营养调查数据。 | 用于学习和实践调查数据分析。 |
| octe.dat | DAT | 一项关于口服避孕药使用与血栓栓塞关联的匹配病例对照研究数据。 | 用于学习和实践匹配病例对照研究分析。 |
| pop.dat | DAT | 阿富汗东北部Khosh Valley地区438名6至60个月大儿童的年龄和性别数据。 | 用于学习和实践创建人口金字塔图等。 |
| salex.dat | DAT | 1992年10月17日一家体育俱乐部食物中毒爆发的数据。 | 用于学习和实践相对风险和优势比分析。 |
| school_nutrition.csv | CSV | 巴基斯坦10岁以上学龄儿童营养调查数据。 | 用于学习和实践调查数据分析。 |
| school_nutrition.xlsx | XLSX | 巴基斯坦10岁以上学龄儿童营养调查数据。 | 用于学习和实践调查数据分析。 |
| south_wollo_coverage.csv | CSV | 埃塞俄比亚South Wollo Zone的CMAM项目数据。 | 用于学习和实践调查数据分析和基本空间分析。 |
| sssw.dat | DAT | 英国152名学生社会工作者的婚姻状况、家庭情况和种族群体数据。 | 用于学习和实践调查数据分析和探索性数据分析的各种图表。 |
| tsstamp.dat | DAT | 一项关于不同品牌卫生棉条使用与中毒性休克综合症关联的匹配病例对照研究数据。 | 用于学习和实践匹配病例对照研究分析。 |
搜集汇总
数据集介绍

构建方式
该数据集专为R语言教学而设计,涵盖了多个领域的实际案例数据,旨在支持开放可重复科学的教学。数据集的构建基于真实的研究和调查数据,包括流行病学、统计学、营养学等多个学科的实际应用场景。每个数据集文件均经过精心挑选和整理,确保其适用于教学目的,并提供了详细的背景信息和用途说明。数据集的格式多样,包括DAT、CSV和XLSX等,便于不同教学场景下的使用。
特点
该数据集的特点在于其多样性和实用性。数据集涵盖了从流行病学到营养学的多个领域,每个数据集都附有详细的描述和用途说明,便于用户快速理解其应用场景。数据集中的案例均基于真实的研究数据,具有高度的真实性和代表性。此外,数据集的格式多样,支持多种统计分析方法,能够满足不同教学需求。数据集还采用了CC0许可,确保了其开放性和可自由使用的特性。
使用方法
该数据集的使用方法灵活多样,适用于R语言的教学和实践。用户可以根据教学需求选择相应的数据集文件,结合数据集提供的背景信息进行教学演示或学生练习。数据集支持多种统计分析方法,如回归分析、生存分析、时间序列分析等,能够帮助学生在实践中掌握相关统计技能。此外,数据集还可用于教学案例的构建,帮助学生理解数据分析和统计建模的实际应用。
背景与挑战
背景概述
teaching_datasets数据集由牛津大学国际健康与热带医学学院(Oxford-IHTM)创建,旨在支持《R语言中的开放可重复科学》系列讲座的教学需求。该数据集汇集了多个与流行病学和统计学相关的教学数据,涵盖了从临床测量方法比较到营养调查等多个领域。这些数据不仅为教学提供了丰富的案例,还促进了R语言在科学数据分析中的应用。数据集自创建以来,已被广泛应用于教学和研究,极大地推动了开放科学和可重复研究的发展。
当前挑战
teaching_datasets数据集在解决流行病学和统计学领域的教学问题时,面临的主要挑战包括如何确保数据的多样性和代表性,以覆盖不同统计方法和分析技术的应用场景。此外,数据集的构建过程中,研究人员需要克服数据收集和整理的复杂性,确保数据的准确性和一致性。另一个挑战是如何在教学中有效利用这些数据集,帮助学生理解复杂的统计概念和方法,同时保持数据的开放性和可访问性,以促进更广泛的教育和研究应用。
常用场景
经典使用场景
在流行病学和统计学教学中,teaching_datasets数据集被广泛用于演示和实践各种统计方法。例如,ba.dat文件用于教授Bland-Altman方法,bateman.dat文件则用于逻辑回归的实践,这些数据集为学习者提供了真实世界的数据,帮助他们理解和掌握复杂的统计技术。
衍生相关工作
基于teaching_datasets数据集,许多经典的研究工作得以展开。例如,octe.dat数据集被用于研究口服避孕药与血栓栓塞之间的关系,salex.dat数据集则用于食物中毒事件的分析。这些研究不仅深化了对特定健康问题的理解,也为相关政策的制定提供了科学依据。
数据集最近研究
最新研究方向
近年来,teaching_datasets数据集在流行病学和统计学领域的教学与研究应用中展现了其独特的价值。该数据集涵盖了从临床测量方法比较到传染病爆发的多个真实案例,为研究者提供了丰富的实践材料。特别是在开放可重复科学的教学中,这些数据集被广泛用于教授统计方法、逻辑回归、生存分析等关键技能。随着数据科学和开放科学的兴起,teaching_datasets不仅支持了R语言的教学,还促进了跨学科研究的发展,尤其是在公共卫生和流行病学领域。其开放获取的特性进一步推动了全球范围内的数据共享与合作研究,为应对全球健康挑战提供了有力的数据支持。
以上内容由遇见数据集搜集并总结生成



