five

Car_mel_100+amino_acids_ORFs_from_1200bp+_contigs_to_Danio_unique_hits

收藏
DataONE2014-01-14 更新2024-06-27 收录
下载链接:
https://search.dataone.org/view/null
下载链接
链接失效反馈
官方服务:
资源简介:
Gene list of only unique hit descriptors for potential open reading frames (ORFs) >=100 amino acids extracted from nucleotide contigs >=1,200 bp assembled from 133,681,136 100 bp pair end (PE) reads from an Illumina HiSeq 2000 using Ray v2.0.0 for Caranx melampygus. Subject database (DB) was the protein list from the fully sequenced genome of Danio available from NCBI. This file is filtered to only contain hits with bit scores >=80.

本数据集为针对黑斑裸颊鲷(Caranx melampygus)的基因列表:首先利用Ray v2.0.0组装软件,将Illumina HiSeq 2000测序平台生成的133,681,136条100 bp双端(pair end, PE)读段进行组装,得到长度≥1200 bp的核苷酸重叠群;随后从该重叠群中提取长度≥100个氨基酸的潜在开放阅读框(open reading frames, ORFs),并筛选出仅包含唯一比对描述符的基因,最终形成本数据集。本次分析所用的比对靶数据库(database, DB)为NCBI公开的丹鱼属(Danio)全测序基因组对应的蛋白序列列表。本文件已完成过滤,仅保留比特得分(bit score)≥80的比对结果。
创建时间:
2014-01-14
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作