2017-2020年国家代谢性疾病标准化管理中心（MMC）队列糖尿病患者临床及流行病学信息数据集|2型糖尿病数据集|临床研究数据集

国家人口健康科学数据中心2024-03-04 收录

2型糖尿病

临床研究

下载链接：

https://www.ncmi.cn/phda/dataDetails.html?type=project_data&id=CSTR:17970.11.A002J.202203.129.V1.0

下载链接

链接失效反馈

资源简介：

建立总例数25万，具有国家代表性的2型糖尿病与糖尿病前期临床研究数据集；此数据集为人群临床信息及流行病学信息数据，通过流行病学调查采集；采集来源为加入国家代谢性疾病标准化管理中心（MMC）的500多家医院糖尿病就诊病人，覆盖全国30个省市自治区，采集时间为2017-2020年；为2型糖尿病与糖尿病前期的预防和诊治研究提供数据基础

提供机构：

上海交通大学医学院附属瑞金医院

创建时间：

2022-04-06

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建，包含5686张图像和45578个标签，重点关注六种行为：举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景，通过YOLOv5、YOLOv7和YOLOv8算法评估，平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础，解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

豆瓣数据集

该数据集通过爬虫技术从豆瓣网站获取了48223条电影数据，并与movielens ml-latest数据集通过共同的imdb字段进行交集处理，最终得到15752条共同数据。数据存储格式为JSON，支持导入到MongoDB或其他数据库使用。

github 收录

BDD100K

数据集推动了视觉的进步，但现有的驾驶数据集在视觉内容和支持任务方面缺乏研究，以研究自动驾驶的多任务学习。研究人员通常只能在一个数据集上研究一小组问题，而现实世界的计算机视觉应用程序需要执行各种复杂的任务。我们构建了最大的驾驶视频数据集 BDD100K，包含 10 万个视频和 10 个任务，以评估图像识别算法在自动驾驶方面的令人兴奋的进展。该数据集具有地理、环境和天气的多样性，这对于训练不太可能对新条件感到惊讶的模型很有用。基于这个多样化的数据集，我们为异构多任务学习建立了一个基准，并研究了如何一起解决这些任务。我们的实验表明，现有模型需要特殊的训练策略来执行此类异构任务。 BDD100K 为未来在这个重要场所的学习打开了大门。更多详细信息请参见数据集主页。

OpenDataLab 收录

YOLO Drone Detection Dataset

为了促进无人机检测模型的开发和评估，我们引入了一个新颖且全面的数据集，专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集，包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象，以实现强大的检测和分类。

github 收录

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性，12位男性)，以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情，歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常，强烈) 下产生的，另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位，48kHz .wav)，音频-视频 (720p H.264，AAC 48kHz，.mp4) 和仅视频 (无声音)。注意，Actor_18没有歌曲文件。

OpenDataLab 收录