Centers for Disease Control and Prevention (CDC) Data and Statistics|公共卫生数据集|疾病预防数据集
收藏
- 美国疾病控制与预防中心(CDC)成立,开始收集和发布公共卫生数据。
- CDC首次发布全国范围内的传染病和非传染病统计数据,标志着其数据收集和分析能力的显著提升。
- CDC开始利用计算机技术进行数据管理和分析,显著提高了数据处理效率和准确性。
- CDC推出首个在线数据查询系统,公众和研究人员首次可以通过互联网访问CDC的公共卫生数据。
- CDC发布了《全国健康和营养调查》(NHANES)数据集,成为全球公共卫生领域的重要参考数据。
- CDC推出《全国健康访谈调查》(NHIS)数据集,进一步丰富了其公共卫生数据资源。
- 在COVID-19大流行期间,CDC迅速响应,实时更新和发布疫情相关数据,成为全球抗击疫情的重要数据来源。
- 1CDC Data and Statistics: A Comprehensive OverviewCenters for Disease Control and Prevention · 2021年
- 2Utilizing CDC Data for Public Health Research: A Case Study on COVID-19Johns Hopkins University · 2022年
- 3The Role of CDC Data in Predictive Modeling for EpidemicsHarvard University · 2023年
- 4CDC Data and Statistics: Challenges and Opportunities in Data IntegrationStanford University · 2022年
- 5Enhancing Public Health Decision-Making with CDC Data: A ReviewUniversity of Oxford · 2023年
MultiTalk
MultiTalk数据集是由韩国科学技术院创建,包含超过420小时的2D视频,涵盖20种不同语言,旨在解决多语言环境下3D说话头生成的问题。该数据集通过自动化管道从YouTube收集,每段视频都配有语言标签和伪转录,部分视频还包含伪3D网格顶点。数据集的创建过程包括视频收集、主动说话者验证和正面人脸验证,确保数据质量。MultiTalk数据集的应用领域主要集中在提升多语言3D说话头生成的准确性和表现力,通过引入语言特定风格嵌入,使模型能够捕捉每种语言独特的嘴部运动。
arXiv 收录
OpenSonarDatasets
OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。
github 收录
ReferCOCO数据集
ReferCOCO数据集包括refcoco、refcoco+和refcocog三个子集,用于视觉定位任务。数据集包含图像和对应的描述性文本,用于训练和测试模型识别图像中特定对象的能力。
github 收录
VisDrone2019
VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。
github 收录
TCGA (The Cancer Genome Atlas)
TCGA数据集包含了多种癌症类型的基因组、转录组和表观遗传学数据,旨在通过大规模的基因组分析来理解癌症的发生和发展机制。
portal.gdc.cancer.gov 收录