five

纳米孔测序生信比对结果

收藏
国家基础学科公共科学数据中心2026-01-30 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=67d50e65195d260905af98c5&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
本项目研究的主要目标是构建和验证引入甲基化修饰碱基的DNA数据存储系统。通过开发设计适配额外编码字母的转码策略,结合DNA合成与纳米孔测序技术,探索修饰碱基作为额外编码字母在DNA数据存储领域应用的可行性。以下是数据概述与实验设计的详细解析。 (1)适配额外编码字母的转码方案设计 在本项目中,设计开发了适配扩展编码字母表的转码方案R+。R+的特点是可扩展性和包容性,在没有高性能转码策略的情况下,当引入额外的分子字母时,R+可以快速为研究人员提供扩展编码字母表和N进制数字之间的直接映射参考。R+的核心在于N进制旋转转码表。在由四种天然碱基组成的标准分子字母表的基础上,将5mC引入其中,便可以得到一个四元旋转转码表。该转码方案的设计是本项目连接数字数据与DNA序列必不可少的环节。 (2)模拟测试转码方案的性能 首先选取几种不同类型的常用数字文件作为待存储文件,通过R+将其编码为DNA字符序列,分析DNA序列的GC含量分布与均聚物长度分布。再人为对DNA字符序列添加不同比例的碱基错误(包括替换、插入与删除),进一步研究转码方案R+对低错误率和高错误率场景的容错性。这一过程为后续实验验证提供理论依据。 (3)湿实验验证基于额外编码字母的DNA数据存储的可行性 对待存储文件进行转码(包括序列分割、异或冗余的添加),得到对应的DNA字符序列。在序列两段添加后续序列组装连接的接头序列后,依据序列信息进行人工合成。为了进一步得到适配纳米孔测序长度的DNA序列,本项目使用T4连接酶分两步对合成得到的DNA短序列进行连接,并通过琼脂糖凝胶电泳来确认是否连接成功。最后利用纳米孔测序对连接生成的DNA长序列进行碱基识别,进一步通过转码算法R+对获取的DNA序列信息进行解码纠错,最终得到存储的数字数据。
提供机构:
中国科学院基础医学与肿瘤研究所(筹)
二维码
社区交流群
二维码
科研交流群
商业服务