five

RefSeq Data & Scripts for ORF dominance

收藏
Figshare2022-04-07 更新2026-04-28 收录
下载链接:
https://figshare.com/articles/dataset/RefSeq_Data_Scripts_for_ORF_dominance/7269500
下载链接
链接失效反馈
官方服务:
资源简介:
This is the fileset for the article "Protein-coding potential of RNAs measured by open reading frame dominance" by Y.Suenaga, et al.This fileset consists of the datasets of human (Feb 2015 and April 2018) and 8 spicies given in the article.[Dataset]- RefSeq gzipped fasta files (data/RefSeq)- Scripts to generate open reading frame (ORF) dominance score and other information from RefSeq data. (script)[How to Run Scripts]- 1. Unpack a tar.xz file.- 2. Run script/01_MergeFa.sh.- 3. Run script/02_ORFdominance.sh.- 4. Run script/03_Format.shUnder data/03_Format, you can get NM.txt and NR.txt as the result.[Note]- Scripts require Linux, bash, and perl.- Scripts use randomized data. Consequently, results differ slightly for the same input data.- Scripts are the same files in "Scripts for ORF dominance" (DOI: 10.6084/m9.figshare.7269518).

本数据集对应Y.Suenaga等人发表的学术论文《通过开放阅读框(Open Reading Frame,ORF)优势度检测RNA的编码潜能》。本数据集包含论文中提及的人类(2015年2月与2018年4月)及8个物种的数据集。 [数据集] - 参考序列数据库(RefSeq)gzip压缩FASTA文件(存储路径:data/RefSeq) - 用于从RefSeq数据中生成开放阅读框(ORF)优势度评分及其他相关信息的脚本(脚本存放于script目录) [脚本运行指南] 1. 解压tar.xz格式压缩包 2. 执行脚本01_MergeFa.sh 3. 执行脚本02_ORFdominance.sh 4. 执行脚本03_Format.sh 在data/03_Format目录下,可获取结果文件NM.txt与NR.txt。 [注意事项] - 脚本运行依赖Linux系统、bash环境及Perl语言环境 - 脚本使用随机化数据,因此相同输入数据每次运行的结果会存在细微差异 - 本脚本与“ORF优势度分析脚本”(DOI: 10.6084/m9.figshare.7269518)中的文件完全一致
创建时间:
2022-04-07
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作