five

Semi-simulated TF pertubation in ATAC-seq datasets (Pertubation strength)

收藏
Mendeley Data2024-05-10 更新2024-06-27 收录
下载链接:
https://zenodo.org/records/10732704
下载链接
链接失效反馈
官方服务:
资源简介:
Semi-simulated ATAC-seq data with TF pertubations of different pertubation strength. The three .tar-files contain: DTFAB_sim_es_beds.tar.gz: .bed files of the semi-simulated ATAC-seq fragments DTFAB_sim_cm.tar.gz: count matrices (per peak counts of semi-simulated fragments) DTFAB_sim_peaks.tar.gz: .bed files with ATAC-seq peak coordinates of semi-simulated fragments The folder structure of 1.,2. & 3. is of the following format <tf>_<pertubation paradigm>_<pertubation_strength>. The corresponding files without any pertubation introduced can be found under data_baseline (peaks in peaks/merged_peaks.narrowPeak). The original samples were retrieved from ENCODE with following IDs: ENCFF495DQP, ENCFF130DND, ENCFF447ZRG, ENCFF966ELR, ENCFF358GWK, ENCFF963YZH. ChIP-seq peaks used to introduce perturbations correspond to following ENCODE identifiers: ENCFF156OCY, ENCFF592UDD, ENCFF250FJC, ENCFF500EWB. This semi-simulated datasets is belongs to a series of datasets: Dataset Description DOI I. pertubation strength (this) TF pertubation with different strengths, no biases introduced 10.5281/zenodo.10732704 II. pos control TF pertubation only introduced in (ChIP-) peaks with a motif of the respective TF. 10.5281/zenodo.10781849 III. fld TF pertubation with additionally introduced fragment length distribution bias 10.5281/zenodo.10781109 IV. gc TF pertubation with additionally introduced GC content bias 10.5281/zenodo.10781759

本数据集为携带不同扰动强度转录因子(Transcription Factor,TF)扰动的半模拟ATAC-seq数据。 本数据集包含三个.tar格式压缩包,具体内容如下: - DTFAB_sim_es_beds.tar.gz:包含半模拟ATAC-seq片段的.bed格式文件; - DTFAB_sim_cm.tar.gz:包含半模拟片段的计数矩阵(即每个染色质峰的片段计数); - DTFAB_sim_peaks.tar.gz:包含半模拟片段对应的ATAC-seq峰坐标的.bed格式文件。 上述三类文件的文件夹命名均遵循如下格式:<转录因子名称>_<扰动模式>_<扰动强度>。 未引入任何扰动的基准对照文件可于data_baseline路径下获取,其中峰文件位于peaks/merged_peaks.narrowPeak。 本数据集的原始样本源自ENCODE数据库,对应的样本标识符为:ENCFF495DQP、ENCFF130DND、ENCFF447ZRG、ENCFF966ELR、ENCFF358GWK、ENCFF963YZH。 用于引入扰动的ChIP-seq峰对应的ENCODE标识符为:ENCFF156OCY、ENCFF592UDD、ENCFF250FJC、ENCFF500EWB。 本半模拟数据集属于一系列配套数据集的一部分,各子系列信息如下: I. 扰动强度系列(本数据集):包含不同强度的转录因子扰动,未引入任何实验偏倚,DOI:10.5281/zenodo.10732704 II. 阳性对照系列:仅在携带对应转录因子基序的(ChIP-seq)峰区域引入转录因子扰动,DOI:10.5281/zenodo.10781849 III. 片段长度分布偏倚系列:在转录因子扰动基础上,额外引入片段长度分布偏倚,DOI:10.5281/zenodo.10781109 IV. GC含量偏倚系列:在转录因子扰动基础上,额外引入GC含量偏倚,DOI:10.5281/zenodo.10781759
创建时间:
2024-03-08
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作