Alzheimer DataLENS|阿尔茨海默病研究数据集|生物信息学数据集
收藏数据集概述
名称: Alzheimer DataLENS
目的: 推进阿尔茨海默病(AD)研究,通过分析、可视化和共享-omics数据。
数据类型:
- 基因表达数据: 包括60个人类微阵列表达谱数据集,涵盖多种神经退行性疾病;30+公共人类数据集,涉及19个脑区和5个队列;多个AD动物模型数据;三个单细胞RNA测序数据集。
- 蛋白质组学数据: 分析了两个蛋白质组学研究,更多研究正在进行中。
- 全基因组关联研究(GWAS): 包括国际阿尔茨海默病基因组项目(IGAP)的GWAS元分析结果和加速药物伙伴关系-阿尔茨海默病(AMP-AD)的GWAS研究结果。
- 通路分析: 包括蛋白质-蛋白质相互作用数据以及表达、表观遗传和遗传数据的整合。
数据集规模: 目前包含超过50个遗传、蛋白质组学和转录组学研究。
数据访问: 由于数据使用协议(DUAs)的限制,数据集不公开,部分数据可应请求提供。
技术平台: 使用R Shiny构建的Web应用程序,后端使用MongoDB数据库。
功能:
- 输入基因: 用户可以输入基因列表,系统将验证基因标识符。
- 差异表达分析: 用户可以选择感兴趣的基因,查看相关的差异表达分析记录。
- 交互网络: 用户可以探索基因间的相互作用,数据来自STRING数据库。
- 区域表达: 用户可以探索特定脑区域的转录组数据。
开发环境: 使用R编程语言和RStudio集成开发环境,依赖多个R包进行数据处理和可视化。
安装和部署: 需要安装R、RStudio、MongoDB等,部署建议使用Shiny Server和MongoDB Atlas。
使用指南: 用户需按照步骤输入基因、进行差异表达分析、探索交互网络和区域表达。
视频演示: 提供了一个YouTube视频链接,展示如何使用Alzheimer DataLENS。
开发者和贡献者: 由Ayush Noori创建,得到MIND Data Science Lab的支持。
参考文献: 提供了几篇与数据集相关的研究文献。

YOLO Drone Detection Dataset
为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。
github 收录
猫狗图像数据集
该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。
github 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
Tropicos
Tropicos是一个全球植物名称数据库,包含超过130万种植物的名称、分类信息、分布数据、图像和参考文献。该数据库由密苏里植物园维护,旨在为植物学家、生态学家和相关领域的研究人员提供全面的植物信息。
www.tropicos.org 收录
中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录