five

SeqLengthPlot outputs on ORFs from the single-end transcriptome of Savalia savaglia

收藏
Mendeley Data2024-06-25 更新2024-06-26 收录
下载链接:
https://data.mendeley.com/datasets/sh79mdcm2c
下载链接
链接失效反馈
官方服务:
资源简介:
This dataset contains the output folder compiled by SeqLengthPlot assessed on the Open Reading Frames (ORFs) translated with the TransDecoder, from the single-end transcriptome of Savalia savaglia. The folder seq_length_Assembly_Ss_SE.Trinity.fasta.transdecoder contains: • seq_above99aa.fasta: Retrieved FASTA file containing the translated ORFs with lengths of 100 aa and above, after splitting of the input FASTA file based on the given threshold. • seq_below100aa.fasta: Retrieved FASTA file containing the translated ORFs with lengths below 100 aa, after splitting of the input FASTA file based on the given threshold. • seq_length_distribution_above99aa.png: PNG image file showing a histogram of ORF lengths of 100 aa and above on a linear scale. • seq_length_distribution_above99_log.png: PNG image file showing a histogram of ORF lengths of 100 aa and above on a logarithmic scale. • seq_length_distribution_below100aa.png: PNG image file showing a histogram of ORF lengths below 100 aa on a linear scale. • seq_length_distribution_below100_log.png: PNG image file showing a histogram of ORF lengths below 100 aa on a logarithmic scale. • seq_length_stats_by_threshold_100.txt: Text file containing detailed statistics of the ORF lengths in the input FASTA file, including the total number of sequences, the number of sequences 100 aa and above, the number of sequences below 100 aa, and the corresponding minimum and maximum lengths.

本数据集包含由SeqLengthPlot针对由TransDecoder翻译得到的开放阅读框(Open Reading Frames, ORFs)进行评估后生成的输出文件夹,该数据集源自萨瓦利亚珊瑚(Savalia savaglia)的单端转录组。该文件夹seq_length_Assembly_Ss_SE.Trinity.fasta.transdecoder包含以下内容: • seq_above99aa.fasta:经按给定阈值拆分输入FASTA格式文件后提取得到的,包含100个氨基酸及以上长度的翻译后开放阅读框的FASTA格式文件。 • seq_below100aa.fasta:经按给定阈值拆分输入FASTA格式文件后提取得到的,包含长度低于100个氨基酸的翻译后开放阅读框的FASTA格式文件。 • seq_length_distribution_above99aa.png:以线性标尺展示100个氨基酸及以上开放阅读框长度分布的直方图PNG图像文件。 • seq_length_distribution_above99_log.png:以对数标尺展示100个氨基酸及以上开放阅读框长度分布的直方图PNG图像文件。 • seq_length_distribution_below100aa.png:以线性标尺展示长度低于100个氨基酸的开放阅读框长度分布的直方图PNG图像文件。 • seq_length_distribution_below100_log.png:以对数标尺展示长度低于100个氨基酸的开放阅读框长度分布的直方图PNG图像文件。 • seq_length_stats_by_threshold_100.txt:包含输入FASTA格式文件中开放阅读框长度详细统计信息的文本文件,统计项涵盖序列总数量、100个氨基酸及以上的序列数、低于100个氨基酸的序列数,以及对应的最小与最大长度。
创建时间:
2024-06-13
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作