five

China Kadoorie Biobank (CKB)|健康研究数据集|慢性病数据集

收藏
www.ckbiobank.org2025-03-04 收录
健康研究
慢性病
下载链接:
https://www.ckbiobank.org/site/
下载链接
链接失效反馈
资源简介:
China Kadoorie Biobank(CKB)是一项大规模的前瞻性队列研究数据库,旨在通过长期跟踪调查收集中国人群的健康相关信息,包括生活方式、环境暴露、生物样本以及疾病发生发展情况,为慢性病的病因研究和防控策略制定提供科学依据。
提供机构:
www.ckbiobank.org
AI搜集汇总
数据集介绍
main_image_url
构建方式
China Kadoorie Biobank(CKB)是一项集合了大量人群健康信息的生物样本库,其构建采用横断面研究设计,自2004年起在对中国十个不同地区超过五十万人进行基线调查,收集了详尽的问卷调查数据、身体测量数据以及生物样本,旨在长期追踪研究慢性疾病与遗传、环境等因素的关联。
使用方法
研究者在使用CKB数据集时,需遵循相应的数据访问政策和伦理审查规定。数据集的获取通常需要通过申请,明确研究目的和数据处理计划。一旦获得授权,研究者可以依托CKB提供的数据管理平台,进行数据下载、分析和挖掘。同时,CKB也提供了数据使用培训和在线支持,以确保数据能够被合理且有效地应用于科学研究之中。
背景与挑战
背景概述
China Kadoorie Biobank(CKB),作为中国最大的一项生物医学研究项目,由我国著名公共卫生专家、香港中文大学流行病学与生物统计学讲座教授林大庆领衔,始于2004年,涵盖了中国10个不同地域的约51万成年人。该数据集的核心研究问题是探索遗传、环境和生活方式因素与慢性疾病如心血管疾病、癌症、糖尿病等的关系,旨在提升对这些疾病的预防、诊断和治疗。CKB数据集因其庞大的样本量、全面的健康相关信息和长期随访,对全球疾病流行病学研究产生了深远影响。
当前挑战
CKB数据集面临的挑战主要涉及数据隐私保护与共享、数据质量控制和多元数据分析。在数据隐私方面,如何在保护参与者个人隐私的同时,实现数据的有效共享与利用是一大难题。数据质量控制挑战在于确保大规模、多源数据的一致性和准确性。多元数据分析的挑战则源于如何从复杂的生物学、环境和社会经济数据中提取有价值的关联信息,并建立疾病发生的因果模型。
发展历史
创建时间与更新
China Kadoorie Biobank (CKB) 自2004年启动,历经数年数据收集与整合,目前已形成庞大的生物信息数据库。更新方面,CKB 定期维护,持续整合新的研究成果与数据。
重要里程碑
CKB 的重要里程碑包括2008年完成首批参与者的数据收集,2011年公开首个研究数据集,以及后续多次向全球研究界开放更为全面的数据资源,极大地推动了精准医学与人群健康研究。
当前发展情况
当前,CKB 已成为全球最大的生物医学数据库之一,对疾病模式研究、药物研发等领域贡献显著。其数据开放共享的策略,为全球健康科学研究提供了宝贵的资源,促进了该领域的国际合作与交流。
发展历程
  • China Kadoorie Biobank (CKB)项目启动,开始招募参与者。
    2004年
  • CKB完成了对约50万成年人的基线调查,收集了详细的问卷调查信息和生物样本。
    2008年
  • CKB发表了首篇研究论文,标志着其研究成果开始对外公布。
    2011年
  • CKB扩展了其研究范围,开始进行后续的随访调查。
    2013年
  • CKB的数据和生物样本资源向全球研究人员开放,促进了国际合作。
    2015年
  • CKB发表了基于其数据的重要研究成果,涉及遗传学、流行病学等多个领域。
    2018年
  • CKB继续开展研究工作,并在全球疫情防控中提供了重要的数据支持。
    2020年
常用场景
经典使用场景
在中国人群中开展的大规模生物银行研究,China Kadoorie Biobank (CKB) 数据集的典型应用场景在于探究遗传、环境因素与慢性疾病之间的关联。该数据集包含了逾五十万参与者的详细信息,为研究者提供了一个宝贵的资源,以进行全基因组关联分析、流行病学研究等。
解决学术问题
CKB 数据集有效解决了大规模队列研究中样本收集、数据质量控制、遗传信息与疾病结局关联分析等关键问题,为揭示诸如心血管疾病、癌症、糖尿病等复杂疾病的病因提供了重要线索,对于理解慢性病的发生机制及其预防策略具有深远影响。
实际应用
在实际应用中,CKB 数据集不仅为医学研究提供了强有力的支持,还助力于公共卫生政策的制定,例如疾病筛查、健康干预等,其实践应用范围遍及医疗、健康管理及生物技术等多个领域。
数据集最近研究
最新研究方向
China Kadoorie Biobank (CKB)作为全球最大的生物样本库之一,近年来其研究重点转向于深度挖掘遗传因素与环境因素在慢性病发生中的交互作用。该数据集的最新研究方向聚焦于精准医疗和疾病预测模型,通过整合多维生物信息,旨在揭示心血管疾病、癌症等重大疾病的风险因素,为制定个体化预防策略和治疗方案提供了科学依据。近期,CKB数据集在揭示生活方式与遗传因素对糖尿病等慢性疾病影响的研究中取得了重要进展,对于提升我国乃至全球慢性病防治水平具有重要意义。
相关研究论文
  • 1
    The China Kadoorie Biobank: study design, methods and participantsUniversity of Oxford · 2008年
  • 2
    Genetic determinants of blood lipids among 300,000 individuals of European ancestry and the impact of rare variantsUniversity of Michigan · 2018年
  • 3
    Genome-wide association study of 14,000 cases of chronic obstructive pulmonary disease from the UK Biobank and the Chinese Kadoorie Biobank Imperial College London · 2019年
  • 4
    China Kadoorie Biobank of 0.5 million people: survey methods, participant characteristics and cohort surveillanceChinese Academy of Medical Sciences · 2011年
  • 5
    The China Kadoorie Biobank and the etiology of stroke: a brief overviewPeking Union Medical College · 2012年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国劳动力动态调查

“中国劳动力动态调查” (China Labor-force Dynamics Survey,简称 CLDS)是“985”三期“中山大学社会科学特色数据库建设”专项内容,CLDS的目的是通过对中国城乡以村/居为追踪范围的家庭、劳动力个体开展每两年一次的动态追踪调查,系统地监测村/居社区的社会结构和家庭、劳动力个体的变化与相互影响,建立劳动力、家庭和社区三个层次上的追踪数据库,从而为进行实证导向的高质量的理论研究和政策研究提供基础数据。

中国学术调查数据资料库 收录

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录

中国区域250米植被覆盖度数据集(2000-2024)

该数据集是中国区域2000至2024年月度植被覆盖度产品,空间分辨率250米,合成方式采用月最大值合成,每年12期,共299期。本产品采用基于归一化植被指数(NDVI)像元二分模型,根据土地利用类型确定纯植被像元值和纯裸土像元值,实现植被覆盖度计算。本产品去除湖泊、河流、冰川/永久积雪等区域。其中,NDVI数据来源于国家青藏高原科学数据中心中国区域250米归一化植被指数数据集(2000-2024)产品。通过时空变化趋势分析检验法分析,该数据集符合时间变化趋势和空间变化趋势。该数据集能够为全国区域生态质量评价、重要生态空间调查评估等工作提供数据参考。

国家青藏高原科学数据中心 收录

中国逐日格点降水数据集V2(1960–2024,0.1°)

CHM_PRE V2数据集是一套高精度的中国大陆逐日格点降水数据集。该数据集基于1960年至今共3476个观测站的长期日降水观测数据,并纳入11个降水相关变量,用于表征降水的相关性。数据集采用改进的反距离加权方法,并结合基于机器学习的LGBM算法构建。CHM_PRE V2与现有的格点降水数据集(包括CHM_PRE V1、GSMaP、IMERG、PERSIANN-CDR和GLDAS)表现出良好的时空一致性。数据集基于63,397个高密度自动雨量站2015–2019年的观测数据进行验证,发现该数据集显著提高了降水测量精度,降低了降水事件的高估,为水文建模和气候评估提供了可靠的基础。CHM_PRE V2 数据集提供分辨率为0.1°的逐日降水数据,覆盖整个中国大陆(18°N–54°N,72°E–136°E)。该数据集涵盖1960–2024年,并将每年持续更新。日值数据以NetCDF格式提供,为了方便用户,我们还提供NetCDF和GeoTIFF格式的年度和月度总降水数据。

国家青藏高原科学数据中心 收录

CHIRPS v2.0

CHIRPS v2.0是一个全球降水数据集,提供高分辨率的降水估计,结合了卫星观测和气象站数据。数据集覆盖全球,时间范围从1981年至今,空间分辨率为0.05度。

www.chc.ucsb.edu 收录