POLYMOD Social Contact Data
收藏github2021-04-20 更新2024-05-31 收录
下载链接:
https://github.com/version-controlled-datasets/version-controlled-data
下载链接
链接失效反馈官方服务:
资源简介:
这是一个版本控制的POLYMOD社交接触数据集,包含从原始数据源到可下载数据集的完整ETL过程。数据集描述了参与者的各种接触情况,包括地点、性别、年龄和国家等特征。
This is a version-controlled POLYMOD social contact dataset, encompassing the complete ETL (Extract, Transform, Load) process from the original data source to the downloadable dataset. The dataset delineates various contact scenarios of participants, including characteristics such as location, gender, age, and country.
创建时间:
2020-04-23
原始信息汇总
POLYMOD 社交接触数据集概述
数据集基本信息
- 样本大小: 97,250
数据集特征
| 特征名称 | 类型 | 描述 |
|---|---|---|
participant_id |
int | 参与者ID |
participant_age |
int | 参与者年龄 |
contact_age |
int | 接触者年龄 |
household_size |
int | 参与者家庭大小 |
contact_home |
bool | 接触是否在家中发生 |
contact_work |
bool | 接触是否在工作场所发生 |
contact_school |
bool | 接触是否在学校发生 |
contact_transport |
bool | 接触是否在交通工具上发生 |
contact_leisure |
bool | 接触是否在休闲活动中发生 |
contact_other |
bool | 接触是否在其他情况下发生 |
gender_female |
bool | 参与者是否为女性 |
gender_male |
bool | 参与者是否为男性 |
country_be |
bool | 参与者是否在比利时 |
country_de |
bool | 参与者是否在德国 |
country_fi |
bool | 参与者是否在芬兰 |
country_gb |
bool | 参与者是否在英国 |
country_it |
bool | 参与者是否在意大利 |
country_nl |
bool | 参与者是否在荷兰 |
country_pl |
bool | 参与者是否在波兰 |
搜集汇总
数据集介绍

构建方式
POLYMOD社交接触数据集的构建过程基于欧洲多国的社会接触调查,涵盖了比利时、德国、芬兰、英国、意大利、荷兰和波兰等国家的数据。数据通过ETL(提取、转换、加载)流程进行处理,确保数据的完整性和一致性。ETL脚本的修改通过Pull Request进行,经过测试和合并后,数据集会从头重新生成。原始数据来源于Zenodo平台,确保了数据的透明性和可追溯性。
特点
该数据集包含了97,250条记录,详细记录了参与者的年龄、家庭规模、接触对象的年龄以及接触发生的场所(如家庭、工作、学校、交通、休闲等)。此外,数据还标注了参与者的性别和所在国家,为研究社交接触模式提供了多维度的信息。数据集的结构清晰,字段类型明确,便于研究人员进行深入分析。
使用方法
研究人员可以通过GitHub仓库访问该数据集,并利用提供的ETL脚本进行数据预处理。数据集的使用方法包括下载原始数据、运行ETL脚本以生成最终数据集,并根据研究需求进行进一步的分析。数据集的字段描述详细,便于用户快速理解数据结构,适用于流行病学、社会学等领域的研究。
背景与挑战
背景概述
POLYMOD社交接触数据集是一个专注于研究社会接触模式的数据库,旨在通过量化个体间的社交互动来理解传染病的传播动态。该数据集由欧洲研究项目POLYMOD于2000年代中期创建,涉及比利时、德国、芬兰、英国、意大利、荷兰和波兰等多个国家的参与者。数据集的核心研究问题在于如何通过社交接触数据预测和模拟传染病的传播路径,从而为公共卫生政策提供科学依据。POLYMOD数据集在流行病学领域具有重要影响力,特别是在传染病建模和防控策略制定方面。
当前挑战
POLYMOD数据集在解决社交接触模式与传染病传播关系的问题时,面临的主要挑战包括数据收集的复杂性和多样性。由于社交接触行为受到文化、地理和社会经济因素的显著影响,如何确保数据的代表性和普适性是一个关键问题。此外,数据集的构建过程中,如何准确记录和分类不同情境下的接触行为(如家庭、工作、学校等)也带来了技术上的挑战。ETL(提取、转换、加载)过程的复杂性进一步增加了数据处理的难度,特别是在确保数据一致性和可重复性方面。
常用场景
经典使用场景
POLYMOD社交接触数据集广泛应用于流行病学研究中,特别是在模拟和预测传染病传播模式时。该数据集提供了详细的社交接触信息,包括接触地点、参与者的年龄和性别等,这些信息对于构建精确的传染病传播模型至关重要。
衍生相关工作
基于POLYMOD数据集,许多研究已经开发出新的传染病传播模型和算法。这些工作不仅扩展了对社交接触模式的理解,还推动了计算流行病学领域的发展,为未来的公共卫生危机管理提供了宝贵的工具和见解。
数据集最近研究
最新研究方向
在社交接触行为研究领域,POLYMOD数据集为分析不同社会环境下的人际互动模式提供了宝贵的数据支持。近年来,随着全球公共卫生事件的频发,该数据集被广泛应用于传染病传播模型的构建与验证,特别是在COVID-19疫情期间,研究者利用POLYMOD数据深入探讨了社交接触行为对病毒传播的影响。此外,结合机器学习技术,研究者进一步挖掘了年龄、性别、家庭规模等因素对社交接触频率和模式的潜在影响,为制定精准的公共卫生干预策略提供了科学依据。POLYMOD数据集的多国覆盖特性也为跨文化比较研究提供了独特视角,推动了全球范围内社交接触行为的系统化研究。
以上内容由遇见数据集搜集并总结生成



