SimOmics
收藏SimOmics 数据集概述
基本信息
- 名称: SimOmics
- 类型: R包工具
- 用途: 模拟真实的多组学数据集
- 适用场景: 数据整合方法基准测试、教学、可重复性测试
主要功能
- 模拟具有自定义维度的多组学数据块(如转录组学、蛋白质组学)
- 注入共享或独立的潜在结构
- 通过块协方差结构控制块间相关性
- 添加高斯噪声以模拟真实世界的信噪比
- 提供PCA、相关热图和潜在组件的可视化功能
- 设计用于与
mixOmics等整合包对接 - 支持导出或使用可重现数据集进行基准测试
安装方法
r install.packages("devtools") devtools::install_github("biosciences/SimOmics")
示例用法
数据模拟与可视化
r sim_data <- simulate_multiomics( n = 200, block_dims = list(transcriptome = 1000, proteome = 200), n_factors = 3, block_corr = 0.4, noise_sd = 0.5, seed = 123 )
监督式整合分析
r Y <- factor(rep(c("A", "B"), each = 100)) res <- block.plsda(X = sim_data$X_blocks, Y = Y, ncomp = 2)
目录结构
txt SimOmics/ ├── R/ # 核心R函数 ├── man/ # 函数文档 ├── vignettes/ # 教程文档(Rmd) ├── tests/testthat/ # 单元测试 ├── paper.md # JOSS论文 ├── paper.bib # JOSS论文参考文献 └── README.md # 项目文档
应用价值
- 完全控制潜在效应和混杂因素
- 统计整合方法的压力测试
- 可重复的方法比较
- 快速原型设计和教学
引用信息
Lai, K. (2025). SimOmics: A Simulation Toolkit for Multivariate and Multi-Omics Data. arXiv: https://doi.org/10.48550/arXiv.2507.09967 (submitted to Journal of Open Source Software).
许可证
MIT © 2025 Kaitao Lai

- 1SimOmics: A Simulation Toolkit for Multivariate and Multi-Omics Data悉尼大学 · 2025年



