wwydmanski/colorectal-carcinoma-microbiome-fengq|结直肠癌数据集|肠道微生物群数据集
收藏数据集概述
基本信息
- 任务类别: 表格分类
- 标签: 微生物组, 表格, 肠道微生物
- 名称: Colorectal Carcinoma Feng Q 2015
- 大小类别: 样本数小于1000
数据集内容
- 样本类型: 156个粪便样本
- 样本来源: 结直肠腺瘤和癌患者及健康对照组
- 数据类型: 宏基因组shotgun测序
配置
presence-absence
CLR
使用示例
python dataset = load_dataset("wwydmanski/colorectal-carcinoma-microbiome-fengq", "presence-absence") train_dataset, test_dataset = dataset[train], dataset[test] X_train = np.array(train_dataset[values]) y_train = np.array(train_dataset[target])
X_test = np.array(test_dataset[values]) y_test = np.array(test_dataset[target])

MeSH
MeSH(医学主题词表)是一个用于索引和检索生物医学文献的标准化词汇表。它包含了大量的医学术语和概念,用于描述医学文献中的主题和内容。MeSH数据集包括主题词、副主题词、树状结构、历史记录等信息,广泛应用于医学文献的分类和检索。
www.nlm.nih.gov 收录
China Groundgroundwater Monitoring Network
该数据集包含中国地下水监测网络的数据,涵盖了全国范围内的地下水位、水质和相关环境参数的监测信息。数据包括但不限于监测站点位置、监测时间、水位深度、水质指标(如pH值、溶解氧、总硬度等)以及环境因素(如气温、降水量等)。
www.ngac.org.cn 收录
中国区域250米植被覆盖度数据集(2000-2024)
该数据集是中国区域2000至2024年月度植被覆盖度产品,空间分辨率250米,合成方式采用月最大值合成,每年12期,共299期。本产品采用基于归一化植被指数(NDVI)像元二分模型,根据土地利用类型确定纯植被像元值和纯裸土像元值,实现植被覆盖度计算。本产品去除湖泊、河流、冰川/永久积雪等区域。其中,NDVI数据来源于国家青藏高原科学数据中心中国区域250米归一化植被指数数据集(2000-2024)产品。通过时空变化趋势分析检验法分析,该数据集符合时间变化趋势和空间变化趋势。该数据集能够为全国区域生态质量评价、重要生态空间调查评估等工作提供数据参考。
国家青藏高原科学数据中心 收录
PeMS04, PeMS07, PeMS08, NYCTaxi
该项目旨在开发一个利用‘传播延迟感知动态长距离转换器’方法的强大交通流量预测系统。系统将使用PeMS04、PeMS07、PeMS08和NYCTaxi数据集来准确预测城市地区的交通流量模式,同时考虑传播延迟。此外,项目的一个交付成果将是使用Looker Studio开发一个交互式仪表板,以可视化和展示交通流量预测。
github 收录
NSL-KDD
NSL-KDD数据集是一个用于测试入侵检测算法的网络流量数据集。它是KDD Cup 1999数据集的改进版本,解决了原始数据集中的冗余记录和类别不平衡问题。该数据集包含训练和测试数据文件,以及包含数据集列名的文件。
github 收录