five

长非编码RNA翻译小蛋白的理论数据库

收藏
国家青藏高原科学数据中心2023-02-09 更新2024-03-06 收录
下载链接:
https://data.tpdc.ac.cn/zh-hans/data/1bca4620-757f-42ac-9677-155d2de178f9
下载链接
链接失效反馈
官方服务:
资源简介:
lncRNAs通常被认为是一类长度大于200个碱基且不编码蛋白的非编码RNAs转录本。然而,近年来,越来越多的研究表明,许多lncRNAs转录本中的小开放阅读框(small open reading frame,smORFs)可以编码多肽(smORF encoded polypeptides,SEPs),后者可广泛参与肌肉形成、粘膜免疫、RNA脱帽及肿瘤增殖等诸多生物学过程。考虑到lncRNAs 转录本及其smORFs 的庞大数量,我们有理由相信SEPs可能代表着一个被忽视并尚待开发的富含蛋白质活性调节因子的宝库。因此,通过对NONCODE数据库中人和小鼠的lncRNA转录本中的smORF进行系统挖掘,分别构建了含有397万和 871万条目的人和小鼠潜在SEP理论数据库。数据收集及质控方面,我们从 NONCODE 数据库 (http://www.noncode.org/) 下载了人类 (NONCODE V4) 和小鼠 (NONCODE 2016) 的 lncRNA 转录本。 使用 ORFfinder 和六帧翻译来确保我们能够检测到所有可能的 smORF,然后将其视为推定的 SEP。 我们通过收集所有长度为 5 到 100 个氨基酸的推定 SEP,为人类和小鼠建立了 SEP 数据库。数据质量也进行了核实。
提供机构:
陈润生
创建时间:
2023-01-17
二维码
社区交流群
二维码
科研交流群
商业服务