five

自开发测序体系输出电信号的解码算法

收藏
国家基础学科公共科学数据中心2026-01-30 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=683de9b2195d2612331896f8&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集包含基于纳米孔测序技术的核酸电信号数据及其相应的碱基识别模型Coral。实验数据采集时间范围为2021年1月至2024年12月,测序信号由北京普译生物科技有限公司的PolyseqOne测序系统和GS71纳米孔测序体系生成,涵盖Lambda DNA、大肠杆菌 E. coli 及人基因组数据。模型设计、训练与验证在中国农业科学院农业基因组研究所的高性能计算平台上完成。Coral 采用编码器-解码器结构,结合 CNN 和 LSTM 网络,利用自回归解码方式进行碱基识别,并通过潜在对齐变量捕捉碱基与测序信号之间的对齐关系。模型的训练和验证遵循国际通用的标准化流程,识别结果通过主流比对工具进行精度和错误率评估。在模型性能评估中,Coral 在标准品核酸测序数据上的平均准确率达到 91%,在训练集中未包含的物种上准确率也达到 90%。该数据集为纳米孔测序信号识别研究提供了重要的数据支持,可用于验证新算法、改进模型架构、研发新测序仪等。数据和模型的开放性为科研和产业界提供了灵活的测试和定制化机会,推动纳米孔测序技术的进一步发展。
提供机构:
中国农业科学院农业基因组研究所
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集提供了基于纳米孔测序技术的核酸电信号数据及相应的碱基识别模型Coral,涵盖Lambda DNA、大肠杆菌和人基因组等样本。模型采用编码器-解码器结构,结合CNN和LSTM网络,在标准品上平均准确率达到91%,支持算法验证和测序技术研发。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务