POLYMOD
收藏github2021-04-20 更新2024-05-31 收录
下载链接:
https://github.com/version-controlled-datasets/polymod
下载链接
链接失效反馈官方服务:
资源简介:
这是一个版本控制的POLYMOD社交接触数据集,包含了详细的ETL过程和数据集特征描述,如参与者ID、年龄、接触地点等。
This is a version-controlled POLYMOD social contact dataset, which includes detailed ETL processes and dataset feature descriptions, such as participant ID, age, contact location, etc.
创建时间:
2020-04-23
原始信息汇总
POLYMOD | Social Contact Data
数据集概述
- 样本大小: 97,250
- 数据处理 (ETL): 详情可见 ETL处理脚本
数据集特征
| 名称 | 类型 | 描述 |
|---|---|---|
participant_id |
int | 参与者ID |
participant_age |
int | 参与者年龄 |
contact_age |
int | 接触者年龄 |
household_size |
int | 参与者家庭大小 |
contact_home |
bool | 接触是否在家中发生 |
contact_work |
bool | 接触是否在工作场所发生 |
contact_school |
bool | 接触是否在学校发生 |
contact_transport |
bool | 接触是否在交通工具上发生 |
contact_leisure |
bool | 接触是否在休闲活动中发生 |
contact_other |
bool | 接触是否在其他情况下发生 |
gender_female |
bool | 参与者是否为女性 |
gender_male |
bool | 参与者是否为男性 |
country_be |
bool | 参与者是否在比利时 |
country_de |
bool | 参与者是否在德国 |
country_fi |
bool | 参与者是否在芬兰 |
country_gb |
bool | 参与者是否在英国 |
country_it |
bool | 参与者是否在意大利 |
country_nl |
bool | 参与者是否在荷兰 |
country_pl |
bool | 参与者是否在波兰 |
搜集汇总
数据集介绍

构建方式
POLYMOD数据集通过欧洲多国的社会接触调查构建而成,涵盖了比利时、德国、芬兰、英国、意大利、荷兰和波兰等国家的数据。数据收集过程包括对参与者的年龄、性别、家庭规模以及接触场景的详细记录。ETL(提取、转换、加载)流程确保了数据的完整性和一致性,所有变更通过PR(拉取请求)进行管理,并在通过测试后重新生成数据集。原始数据来源于Zenodo平台,确保了数据的透明性和可追溯性。
特点
POLYMOD数据集以其广泛的地理覆盖和多样化的社会接触场景为特点。数据集包含97,250条记录,详细记录了参与者的年龄、性别、家庭规模以及接触发生的具体场景(如家庭、工作、学校、交通、休闲等)。此外,数据集还提供了参与者所在国家的信息,便于进行跨国比较研究。这些特征使得POLYMOD成为研究社会接触模式及其对传染病传播影响的宝贵资源。
使用方法
POLYMOD数据集的使用方法灵活多样,适用于多种研究场景。研究人员可以通过GitHub仓库访问数据集,并根据需要进行ETL流程的修改。数据集的结构清晰,包含参与者ID、年龄、接触场景等关键字段,便于进行数据分析和建模。通过结合不同国家的数据,研究者可以深入探讨社会接触模式的地域差异及其对公共卫生政策的影响。此外,数据集的开源特性为跨学科合作提供了便利。
背景与挑战
背景概述
POLYMOD数据集是一个专注于社会接触行为的研究数据集,旨在揭示不同社会环境中人与人之间的接触模式。该数据集由欧洲多个研究机构合作创建,主要研究人员包括流行病学和社会行为学领域的专家。数据集的核心研究问题是通过分析不同年龄、性别、家庭规模以及不同国家背景下的接触行为,为传染病传播模型提供基础数据支持。自2005年发布以来,POLYMOD数据集在流行病学、公共卫生和社会行为学领域产生了深远影响,特别是在COVID-19疫情期间,为政策制定者提供了重要的数据支持。
当前挑战
POLYMOD数据集在解决社会接触行为建模问题时面临多重挑战。首先,数据收集过程中需要确保样本的代表性和多样性,涵盖不同国家、年龄和性别的人群,这对数据采集的广度和深度提出了较高要求。其次,接触行为的定义和分类较为复杂,例如家庭、工作、学校等不同场景下的接触模式差异显著,如何准确捕捉这些细节是构建数据集的关键难点。此外,数据清洗和预处理过程中,如何处理缺失值、异常值以及确保数据一致性也是技术上的重要挑战。这些挑战不仅影响了数据集的构建效率,也对后续研究的准确性和可靠性提出了更高要求。
常用场景
经典使用场景
POLYMOD数据集广泛应用于流行病学研究,特别是在模拟传染病传播模型时,提供了详细的社会接触数据。研究者利用这些数据,可以精确地模拟不同年龄、性别和地理位置的个体之间的接触模式,从而预测疾病的传播路径和速度。
解决学术问题
POLYMOD数据集解决了流行病学研究中关于社会接触模式的数据稀缺问题。通过提供跨多个国家的详细接触数据,研究者能够更准确地构建传染病传播模型,评估不同干预措施的效果,如隔离、疫苗接种等,从而为公共卫生政策的制定提供科学依据。
衍生相关工作
POLYMOD数据集催生了许多经典的研究工作,如基于接触网络的传染病传播模型、社会接触模式的地理差异分析等。这些研究不仅深化了对传染病传播机制的理解,还为未来的流行病学研究提供了宝贵的数据和方法学参考。
以上内容由遇见数据集搜集并总结生成



