five

Supplementary Files

收藏
Mendeley Data2024-01-31 更新2024-06-28 收录
下载链接:
https://figshare.com/articles/dataset/Supplementary_Files/21995192/3
下载链接
链接失效反馈
官方服务:
资源简介:
Important files containing frequently used gene and TE annotation files 1. MANE_genes_hg38: MANE annotated gene lists 2. hg38_gencode_rmsk_indi: Combination of TE individual gtf file and hg38 gencode V41 gtf file 3. hg38_repeatmasker: RepeatMasker database for hg38 4. hg38_gencode_rmsk_indi_loc_annotate: TE locational information(exonic, intronic, intergenic) at individual levels 4.long_read_TPM_simulation:TPM values from long-read used during simulating short-read in Spanki

本数据集收录若干常用基因与转座子(Transposable Element, TE)注释文件,具体如下: 1. MANE_genes_hg38:MANE注释基因列表 2. hg38_gencode_rmsk_indi:转座子个体GTF(General Feature Format, 通用特征格式)文件与hg38 Gencode V41 GTF文件的整合文件 3. hg38_repeatmasker:针对hg38构建的RepeatMasker数据库 4. hg38_gencode_rmsk_indi_loc_annotate:个体水平转座子的位置注释信息,包含外显子区、内含子区与基因间区 4. long_read_TPM_simulation:Spanki软件在模拟短读长测序数据过程中,所使用的长读长测序数据对应的TPM(Transcripts Per Million, 每百万转录本)值
创建时间:
2024-01-31
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含四个重要文件,涉及MANE注释基因列表、TE个体gtf文件与hg38 gencode V41 gtf文件的组合、hg38的RepeatMasker数据库以及TE位置信息。数据集使用CC BY 4.0许可,适用于生物信息学方法和基因组学与转录组学研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作