Alzheimer DataLENS|阿尔茨海默病研究数据集|生物信息学数据集
收藏数据集概述
名称: Alzheimer DataLENS
目的: 推进阿尔茨海默病(AD)研究,通过分析、可视化和共享-omics数据。
数据类型:
- 基因表达数据: 包括60个人类微阵列表达谱数据集,涵盖多种神经退行性疾病;30+公共人类数据集,涉及19个脑区和5个队列;多个AD动物模型数据;三个单细胞RNA测序数据集。
- 蛋白质组学数据: 分析了两个蛋白质组学研究,更多研究正在进行中。
- 全基因组关联研究(GWAS): 包括国际阿尔茨海默病基因组项目(IGAP)的GWAS元分析结果和加速药物伙伴关系-阿尔茨海默病(AMP-AD)的GWAS研究结果。
- 通路分析: 包括蛋白质-蛋白质相互作用数据以及表达、表观遗传和遗传数据的整合。
数据集规模: 目前包含超过50个遗传、蛋白质组学和转录组学研究。
数据访问: 由于数据使用协议(DUAs)的限制,数据集不公开,部分数据可应请求提供。
技术平台: 使用R Shiny构建的Web应用程序,后端使用MongoDB数据库。
功能:
- 输入基因: 用户可以输入基因列表,系统将验证基因标识符。
- 差异表达分析: 用户可以选择感兴趣的基因,查看相关的差异表达分析记录。
- 交互网络: 用户可以探索基因间的相互作用,数据来自STRING数据库。
- 区域表达: 用户可以探索特定脑区域的转录组数据。
开发环境: 使用R编程语言和RStudio集成开发环境,依赖多个R包进行数据处理和可视化。
安装和部署: 需要安装R、RStudio、MongoDB等,部署建议使用Shiny Server和MongoDB Atlas。
使用指南: 用户需按照步骤输入基因、进行差异表达分析、探索交互网络和区域表达。
视频演示: 提供了一个YouTube视频链接,展示如何使用Alzheimer DataLENS。
开发者和贡献者: 由Ayush Noori创建,得到MIND Data Science Lab的支持。
参考文献: 提供了几篇与数据集相关的研究文献。

中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
Food-11
This is a dataset containing 16643 food images grouped in 11 major categories
kaggle 收录
38-Cloud
该数据集包含38幅Landsat 8场景图像及其手动提取的像素级云检测地面实况。数据集被分割成多个384*384的补丁,适合深度学习语义分割算法。训练集有8400个补丁,测试集有9201个补丁。每个补丁包含4个对应的谱通道:红色、绿色、蓝色和近红外。
github 收录
Subway Dataset
该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。
www.kaggle.com 收录
CBIS-DDSM
该数据集用于训练乳腺癌分类器或分割模型,包含3103张乳腺X光片,其中465张有多个异常。数据集分为训练集和测试集,还包括3568张裁剪的乳腺X光片和对应的掩码。
github 收录