Global Health Observatory (GHO) Data|全球健康数据集|数据监测数据集
收藏
- 世界卫生组织(WHO)首次发布Global Health Observatory (GHO) Data,作为其全球卫生观察站的核心数据平台,旨在提供全球卫生统计数据和分析。
- GHO Data开始整合多个WHO数据库,包括世界卫生统计数据、全球卫生估计和全球疾病负担数据,以提供更全面和一致的全球卫生信息。
- GHO Data首次应用于全球卫生报告,为政策制定者和研究人员提供了关键的卫生指标和趋势分析,支持全球卫生政策的制定和评估。
- GHO Data引入了新的数据可视化工具和交互式图表,增强了用户对全球卫生数据的访问和理解能力。
- GHO Data开始与全球卫生伙伴合作,包括联合国机构、非政府组织和学术机构,以扩大其数据覆盖范围和影响力。
- 在COVID-19大流行期间,GHO Data成为全球疫情监测和响应的关键工具,提供了实时疫情数据和分析,支持全球公共卫生应对措施。
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
Plants of the World Online (POWO)
Plants of the World Online (POWO) 是一个全球植物数据库,提供了关于植物物种的详细信息,包括分类学、分布、生态学和保护状态等。该数据库旨在为植物学家、生态学家和公众提供一个全面的植物信息资源。
powo.science.kew.org 收录
CMAB
CMAB数据集由清华大学创建,是中国首个全国范围的多属性建筑数据集,涵盖了3667个自然城市,总面积达213亿平方米。该数据集通过集成多源数据,如高分辨率Google Earth影像和街景图像,生成了建筑的屋顶、高度、功能、年龄和质量等属性。数据集的创建过程结合了地理人工智能框架和机器学习模型,确保了数据的高准确性。CMAB数据集主要应用于城市规划和可持续发展研究,旨在提供详细的城市3D物理和社会结构信息,支持城市化进程和政府决策。
arXiv 收录
Traditional-Chinese-Medicine-Dataset-SFT
该数据集是一个高质量的中医数据集,主要由非网络来源的内部数据构成,包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容,质量优异,信息密度可观。数据集适用于预训练或继续预训练用途,未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用,但建议先使用配套的预训练数据集对模型进行继续预训练后,再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据,以避免灾难性遗忘并加强模型表现。
huggingface 收录