all-human-diseases
收藏Hugging Face2024-08-14 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/nisten/all-human-diseases
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含一个关于人类疾病的草拟列表,未来将增加更多数据。数据集采用AGPL-3.0许可证,强调科学证据基础的医学,不接受个人意见。数据来源包括CDC、维基百科等。
创建时间:
2024-08-14
原始信息汇总
所有人类疾病数据集
数据集概述
该数据集旨在列出所有人类疾病,目前为草稿版本,未来将增加更多数据。
许可证
数据集的许可证为AGPL-3.0,旨在防止掠夺性使用,允许个人或初创公司使用。
数据来源
数据集的来源包括:
- 美国疾病控制与预防中心(CDC)的健康主题页面
- 存档的Vistainformatics疾病列表
- 维基百科上的多个相关列表,包括人类疾病死亡率、传染病、可报告疾病等
数据格式
数据以Google表格形式提供,链接如下: Google表格链接
使用注意事项
- 该数据集基于科学证据,不接受个人意见。
- 如发现问题,请在Hugging Face或Google文档中留言。
搜集汇总
数据集介绍

构建方式
all-human-diseases数据集通过整合多个权威来源的信息构建而成,包括美国疾病控制与预防中心(CDC)的健康主题页面、Vista Informatics的疾病列表、以及维基百科中关于人类疾病致死率、传染病、死亡原因和应报告疾病的列表。数据集的构建严格遵循科学证据,排除了任何主观意见,确保了数据的客观性和可靠性。
特点
该数据集涵盖了广泛的人类疾病信息,具有高度的全面性和权威性。其数据来源多样,涵盖了从传染病到慢性病的多种疾病类型,且每一条数据都基于科学证据,确保了信息的准确性和可信度。此外,数据集采用AGPL许可证,旨在防止商业滥用,同时鼓励学术和非商业用途的自由使用。
使用方法
all-human-diseases数据集适用于医学研究、公共卫生分析以及疾病预防策略的制定。用户可以通过HuggingFace平台访问数据集,并根据需要下载和使用。数据集的使用者可以在相关文档中提出问题和建议,以促进数据的持续改进和更新。数据集的使用应严格遵循科学原则,避免引入任何主观意见。
背景与挑战
背景概述
all-human-diseases数据集旨在全面收录人类疾病的相关信息,其创建初衷是为了提供一个科学证据为基础的疾病数据库,以支持医学研究和公共卫生决策。该数据集由匿名研究人员或机构开发,主要依托于美国疾病控制与预防中心(CDC)等权威机构的公开数据,并结合了维基百科等开放资源。其核心研究问题在于如何系统化地整理和验证全球范围内的人类疾病信息,从而为医学界提供一个可靠且全面的参考工具。该数据集的发布对疾病分类、流行病学研究以及公共卫生政策的制定具有重要的参考价值。
当前挑战
all-human-diseases数据集在构建过程中面临多重挑战。首先,疾病信息的多样性和复杂性使得数据收集和标准化成为一项艰巨任务,尤其是不同来源的数据可能存在不一致或重复。其次,确保数据的科学性和权威性至关重要,这要求对每一条疾病信息进行严格的证据验证,避免主观意见的干扰。此外,数据集的持续更新和维护也是一个长期挑战,因为新疾病的出现和现有疾病信息的更新需要及时反映在数据集中。最后,如何在开放共享与防止数据滥用之间找到平衡,也是数据集开发者需要解决的问题。
常用场景
经典使用场景
在医学研究和公共卫生领域,all-human-diseases数据集为研究人员提供了一个全面的人类疾病列表,涵盖了从常见病到罕见病的广泛范围。这一数据集常用于疾病分类、流行病学研究以及健康政策制定,帮助研究者深入理解疾病的分布、传播模式及其对人口健康的影响。
实际应用
在实际应用中,all-human-diseases数据集被广泛用于公共卫生监测系统的构建、疾病风险评估模型的开发以及医疗资源的优化配置。例如,政府部门可以利用该数据集制定针对特定疾病的防控政策,医疗机构则可通过分析疾病数据优化诊疗流程,提升医疗服务的效率和质量。
衍生相关工作
基于all-human-diseases数据集,许多经典研究工作得以展开。例如,研究者利用该数据集开发了疾病预测模型,用于评估特定地区或人群的疾病风险;此外,该数据集还被用于构建疾病知识图谱,为人工智能驱动的医疗诊断系统提供数据支持。这些衍生工作不仅拓展了数据集的应用范围,也为医学研究和实践带来了深远影响。
以上内容由遇见数据集搜集并总结生成



