DNA-Dataset
收藏github2017-11-06 更新2024-05-31 收录
下载链接:
https://github.com/GeneDNAx/DNA-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
酵母中核小体乙酰化和甲基化的全基因组图谱数据集,包含多个与核小体相关的数据文件,如H3、H4、H3K9ac等,用于研究基因组中的核小体修饰情况。
The genome-wide mapping dataset of nucleosome acetylation and methylation in yeast includes multiple data files related to nucleosomes, such as H3, H4, H3K9ac, etc., used for studying nucleosome modifications in the genome.
创建时间:
2017-10-30
原始信息汇总
small-Dataset 概述
数据集描述
本数据集包含酵母基因组范围内核小体乙酰化和甲基化的相关数据。
数据集内容
数据集包含以下文件,每个文件对应不同的生物标记及其状态:
- H3.txt: H3 占用情况
- H4.txt: H4 占用情况
- H3K9ac.txt: H3K9 乙酰化相对于 H3
- H3K14ac.txt: H3K14 乙酰化相对于 H3
- H4ac.txt: H4 乙酰化相对于 H3
- H3K4me1.txt: H3K4 单甲基化相对于 H3
- H3K4me2.txt: H3K4 二甲基化相对于 H3
- H3K4me3.txt: H3K4 三甲基化相对于 H3
- H3K36me3.txt: H3K36 三甲基化相对于 H3
- H3K79me3.txt: H3K79 三甲基化相对于 H3
数据集详细信息
| 生物标记 | 阳性样本数 | 阴性样本数 | 描述 |
|---|---|---|---|
| H3 | 7667 | 7298 | H3 占用 |
| H4 | 6480 | 8121 | H4 占用 |
| H3K9ac | 15415 | 12367 | H3K9 乙酰化 |
| H3K14ac | 18771 | 14277 | H3K14 乙酰化 |
| H4ac | 18410 | 15685 | H4 乙酰化 |
| H3K4me1 | 17266 | 14411 | H3K4 单甲基化 |
| H3K4me2 | 18143 | 12540 | H3K4 二甲基化 |
| H3K4me3 | 19604 | 17195 | H3K4 三甲基化 |
| H3K36me3 | 18892 | 15988 | H3K36 三甲基化 |
| H3K79me3 | 15337 | 13500 | H3K79 三甲基化 |
搜集汇总
数据集介绍

构建方式
DNA-Dataset的构建是基于酵母全基因组范围内组蛋白乙酰化和甲基化修饰的映射数据。该数据集通过对比不同修饰状态下组蛋白H3和H4的占有率,以及相对于H3的乙酰化和甲基化程度,收集了正负样本共十类,形成了一个全面覆盖各种修饰状态的数据库。
特点
该数据集的特点在于其涵盖了酵母基因组中的多种组蛋白修饰状态,包括H3、H4及其不同乙酰化和甲基化形式。每种类别的数据均包含正负样本,便于研究者进行对比分析。数据以文本文件形式存储,分类清晰,便于检索和利用。
使用方法
使用DNA-Dataset时,用户可以依据具体的研究需求选择相应的数据类别。数据集以.txt文件形式提供,可直接通过文本编辑器或编程语言进行读取和处理。用户可利用这些数据进行模式识别、统计分析等研究,以揭示组蛋白修饰与基因表达之间的关联性。
背景与挑战
背景概述
DNA-Dataset是一个关于酵母全基因组范围内核小体乙酰化和甲基化图谱的数据集。该数据集的创建旨在为研究者提供一个全面的研究工具,以探究基因表达调控机制中的表观遗传学标记。该数据集由多个研究机构合作完成,首次发布于2010年左右,包含了酵母细胞在不同条件下的表观遗传学修饰数据,主要研究人员包括多位表观遗传学领域的知名学者。DNA-Dataset对表观遗传学、基因组学以及生物信息学等领域产生了深远影响,为相关研究提供了宝贵的数据资源。
当前挑战
尽管DNA-Dataset为相关领域的研究提供了重要支持,但在使用过程中也存在一些挑战。首先,数据集构建过程中,确保不同实验条件下的数据一致性和准确性是一大难题。其次,数据集的规模和复杂性对数据分析技术提出了较高要求,需要研究者具备相应的生物信息学知识和计算能力。此外,如何从海量的表观遗传学数据中提取有用信息,发现生物学规律,也是当前面临的挑战之一。
常用场景
经典使用场景
在基因组学领域,DNA-Dataset被广泛用于探究酵母中组蛋白修饰的全基因组分布。该数据集详细记录了H3、H4等组蛋白在不同修饰状态下的占有率,为研究染色质结构与基因表达调控提供了基础数据。
解决学术问题
DNA-Dataset为学者们解决了在基因表达调控研究中,如何获取精确组蛋白修饰位点信息的问题。它使得研究者能够更好地理解组蛋白修饰对染色质可及性和基因表达的影响,进而揭示基因调控的分子机制。
衍生相关工作
基于DNA-Dataset的研究衍生了多项经典工作,如开发新的生物信息学工具来分析组蛋白修饰数据,以及结合其他组学数据探索基因调控网络,推动了基因组学研究领域的进展。
以上内容由遇见数据集搜集并总结生成



