five

The SEER Program|癌症研究数据集|公共卫生数据集

收藏
seer.cancer.gov2024-10-25 收录
癌症研究
公共卫生
下载链接:
https://seer.cancer.gov/
下载链接
链接失效反馈
资源简介:
The SEER Program(Surveillance, Epidemiology, and End Results Program)是美国国家癌症研究所(NCI)的一个项目,旨在收集和分析癌症统计数据。该数据集包括了美国多个地区的癌症发病率、死亡率和生存率等信息,涵盖了多种癌症类型和人口统计学数据。
提供机构:
seer.cancer.gov
AI搜集汇总
数据集介绍
main_image_url
构建方式
The SEER Program数据集的构建基于美国国家癌症研究所(NCI)的监测、流行病学和最终结果(SEER)计划。该计划自1973年以来,通过与多个州的癌症登记处合作,收集了大量关于癌症发病率和生存率的数据。数据集的构建过程包括从医院、诊所和病理实验室收集病例信息,涵盖了患者的诊断、治疗和生存状态等详细信息。通过标准化数据录入和质量控制措施,确保数据的准确性和一致性。
特点
The SEER Program数据集以其广泛的地理覆盖和长期的纵向数据而著称。该数据集包含了超过40年的癌症病例记录,涵盖了美国多个州和地区,提供了丰富的癌症流行病学信息。此外,数据集还包含了多种癌症类型的详细信息,包括发病年龄、性别、种族、诊断阶段和治疗方法等,为癌症研究和公共卫生政策制定提供了宝贵的资源。
使用方法
The SEER Program数据集主要用于癌症流行病学研究、公共卫生政策制定和临床研究。研究人员可以通过访问SEER数据库,分析不同癌症类型的发病率和生存率趋势,评估不同治疗方法的效果,以及探索癌症风险因素。数据集的使用需要遵守NCI的数据使用协议,确保数据的隐私和安全。研究人员可以通过申请获得访问权限,并使用统计软件进行数据分析,以支持科学研究和政策制定。
背景与挑战
背景概述
The SEER Program(Surveillance, Epidemiology, and End Results Program)是由美国国家癌症研究所(NCI)于1973年启动的一项重要公共卫生项目。该项目旨在通过收集和分析癌症病例数据,提供关于癌症发病率、死亡率和生存率的全面信息。SEER数据集涵盖了美国多个地区的癌症病例,包括详细的临床和人口统计学信息,为癌症研究、预防和治疗策略的制定提供了宝贵的数据支持。该数据集的创建不仅推动了癌症流行病学的发展,还对全球公共卫生政策的制定产生了深远影响。
当前挑战
尽管SEER数据集在癌症研究领域具有重要价值,但其构建和应用过程中仍面临诸多挑战。首先,数据的质量和完整性是关键问题,确保病例信息的准确性和及时更新是持续的挑战。其次,数据隐私和安全问题在处理大量敏感医疗信息时尤为突出,需要严格的数据保护措施。此外,SEER数据集的复杂性要求研究人员具备高度的专业知识和技能,以有效提取和分析数据。最后,跨地区和跨时间的癌症数据标准化和一致性问题,也是该数据集在实际应用中需要克服的难题。
发展历史
创建时间与更新
The SEER Program数据集创建于1973年,由美国国家癌症研究所(NCI)发起,旨在收集和分析癌症发病率和生存率数据。该数据集定期更新,最新数据涵盖至2018年,反映了近半个世纪的癌症统计信息。
重要里程碑
The SEER Program的重要里程碑包括1973年的启动,标志着癌症统计数据系统化的开始;1992年,数据集扩展至涵盖更多种族和民族群体,增强了其代表性和多样性;2000年,引入地理信息系统(GIS)技术,使得空间分析成为可能,进一步提升了数据的应用价值。
当前发展情况
当前,The SEER Program已成为全球癌症研究和公共卫生政策制定的重要参考。其数据被广泛用于癌症流行病学研究、预防策略制定以及医疗资源分配优化。随着大数据和人工智能技术的发展,该数据集的应用前景更加广阔,预计将在个性化医疗和精准治疗领域发挥关键作用。
发展历程
  • The SEER Program首次启动,旨在收集和分析美国癌症病例的数据,以支持癌症研究和公共卫生政策制定。
    1973年
  • SEER数据库首次公开发布,包含来自多个地区的癌症病例数据,标志着其作为公共资源的重要里程碑。
    1975年
  • SEER Program扩展其覆盖范围,增加了更多的地理区域和人口群体,以提高数据的代表性和广泛性。
    1980年
  • SEER数据库开始采用国际疾病分类(ICD)标准,以确保数据的一致性和国际可比性。
    1992年
  • SEER Program引入更详细的数据收集标准,包括分子生物学和遗传学信息,以支持精准医学的发展。
    2000年
  • SEER数据库开始提供在线数据访问和分析工具,促进了研究人员和公众对癌症数据的利用和理解。
    2010年
  • SEER Program继续扩展其数据收集和分析能力,支持全球癌症研究和公共卫生策略的制定。
    2020年
常用场景
经典使用场景
在癌症研究领域,The SEER Program数据集被广泛用于分析不同地区、种族和性别之间的癌症发病率和生存率差异。通过该数据集,研究人员能够深入探讨癌症的流行病学特征,为制定针对性的公共卫生策略提供科学依据。
实际应用
在实际应用中,The SEER Program数据集被用于指导癌症筛查项目的实施,评估不同治疗方案的效果,以及监测癌症发病趋势。医疗机构和公共卫生部门利用这些数据制定更有效的癌症防控措施,从而提高患者的生存率和生活质量。
衍生相关工作
基于The SEER Program数据集,许多经典研究工作得以开展,如癌症发病率的时间趋势分析、不同治疗手段的疗效比较等。此外,该数据集还催生了多个癌症预测模型和风险评估工具,为个性化医疗提供了重要支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

URPC系列数据集, S-URPC2019, UDD

URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。

github 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

Materials Project

材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)

OpenDataLab 收录