Global Burden of Disease Study (GBD)|健康统计数据集|全球疾病负担数据集
收藏.png)
- 全球疾病负担研究(Global Burden of Disease Study, GBD)首次发表,由哈佛大学公共卫生学院的Christopher Murray教授和Alan Lopez教授领导,旨在量化全球疾病、伤害和危险因素的负担。
- GBD 1996年更新版发布,进一步细化了疾病分类和负担评估方法,首次引入了伤残调整生命年(DALYs)作为衡量健康损失的综合指标。
- GBD 2000年更新版发布,扩展了研究范围,涵盖了更多的国家和地区,并增加了对非传染性疾病和伤害的详细分析。
- GBD 2010年更新版发布,由华盛顿大学健康指标与评估研究所(IHME)主导,采用了更先进的数据收集和分析方法,提供了更精确的全球健康负担估计。
- GBD 2013年更新版发布,进一步改进了数据模型和方法,首次提供了按年龄、性别和地区细分的全球健康负担数据,并强调了非传染性疾病和伤害的日益重要性。
- GBD 2016年更新版发布,继续深化对全球健康负担的分析,增加了对新兴健康问题的关注,如抗生素耐药性和空气污染对健康的影响。
- GBD 2019年更新版发布,提供了最新的全球健康负担数据,强调了全球健康不平等的持续存在,并提出了应对策略和政策建议。
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
MultiTalk
MultiTalk数据集是由韩国科学技术院创建,包含超过420小时的2D视频,涵盖20种不同语言,旨在解决多语言环境下3D说话头生成的问题。该数据集通过自动化管道从YouTube收集,每段视频都配有语言标签和伪转录,部分视频还包含伪3D网格顶点。数据集的创建过程包括视频收集、主动说话者验证和正面人脸验证,确保数据质量。MultiTalk数据集的应用领域主要集中在提升多语言3D说话头生成的准确性和表现力,通过引入语言特定风格嵌入,使模型能够捕捉每种语言独特的嘴部运动。
arXiv 收录
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
glaive-function-calling-openai
该数据集包含用于训练和评估语言模型在函数调用能力上的对话示例。数据集包括一个完整的函数调用示例集合和一个精选的子集,专注于最常用的函数。数据集的结构包括一个完整的数据集和几个测试子集。每个记录都是一个JSON对象,包含对话消息、可用函数定义和实际的函数调用。数据集还包括最常用的函数分布信息,并提供了加载和评估数据集的示例代码。
huggingface 收录
中国1km分辨率逐月NDVI数据集(2001-2023年)
中国1km分辨率逐月NDVI数据集(2001-2023年)根据MODIS MOD13A2数据进行月度最大值合成、镶嵌和裁剪后制作而成,包含多个TIF文件,每个TIF文件对应该月最大值NDVI数据,文件以时间命名。数据值域改为-0.2~1,不再需要除以一万,另外范围扩大到中国及周边地区,可以自行裁剪。数据分为两个文件夹,MVC文件夹中为MOD13A2 NDVI逐月最大值合成结果,mod1k_SGfilter为MVC中数据S-G滤波后的结果。
国家地球系统科学数据中心 收录