多参数打印合成DNA序列测序数据集
收藏国家基础学科公共科学数据中心2026-01-30 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=6742411b195d262b8b446a86&type=1
下载链接
链接失效反馈官方服务:
资源简介:
本数据集中,利用DNA喷泉码(Fountain Code)编码两幅图片,获得含4种天然碱基序列经低密度打印合成(100条/平方毫米,868条)和高密度打印(200条/平方毫米,1614条);利用Mapping映射算法编码四个文本文件,获得含ZP两类非天然碱基和ATGC四种非天然碱基共计六种碱基的四条DNA序列经高通量固相合成仪合成;利用Base64(RaptorQ-ArithmeticBase64-RS)编码两幅图片文件,获得含ATGC+ZP六种碱基的368条序列和含简并碱基的1600条序列,经高密度打印(200条/mm2)合成,上述所有DNA产物经两家专业公司利用两种二代测序仪器获得原始测序数据,并出具数据信息报告。上述三幅图片(.jpg)和四个文本 (.zip)及其生成的序列信息(.fa)以及打印芯片测试报告(.pdf);双来源测序信息原始文件生成为fastq.gz文件及其测序报告(.pdf),共同组成本数据集。
提供机构:
上海交通大学
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含使用多种编码方法将图片和文本文件转化为DNA序列的数据,这些序列通过不同密度的打印技术合成,并经由两家公司使用二代测序仪器获取原始测序数据。数据集由生成的序列文件、原始测序数据及相关报告组成。
以上内容由遇见数据集搜集并总结生成



