five

Dados de genotipagem da Coleção Nuclear de Arroz da Embrapa por 4.709 SNPs

收藏
DataCite Commons2022-12-16 更新2025-04-16 收录
下载链接:
https://www.redape.dados.embrapa.br/citation?persistentId=doi:10.48432/J9YG00
下载链接
链接失效反馈
官方服务:
资源简介:
Esse conjunto de dados foi elaborado para permitir uma ampla amostragem do genoma do arroz por um número reduzido de marcadores SNPs (Single Nucleotide Polymorphisms), e com isso viabilizar análises que requerem grande demanda computacional, como machine learning, por exemplo. O conjunto é composto por dados de genotipagem de 541 acessos da Coleção Nuclear de Arroz da Embrapa (CNAE) por 4.709 SNPs, tendo em média um SNP a cada 68.000 pares de base (pb), que é inferior ao desequilíbrio de ligação médio do arroz, em torno de 150.000 pb. Esse conjunto de dados foi elaborado a partir de um conjunto completo, composto por aproximadamente 400.000 SNPs. O diferencial desse conjunto de marcadores SNPs é que ele genotipou majoritariamente o germoplasma brasileiro de arroz, presente na CNAE, e que compõe a base genética do programa de melhoramento de arroz da Embrapa, que é marcadamente diferente da base genética do arroz asiático.

本数据集旨在通过少量单核苷酸多态性(Single Nucleotide Polymorphisms,简称SNPs)标记实现水稻基因组的广泛采样,以此支撑机器学习等计算密集型分析工作。数据集包含巴西农业研究公司(Embrapa)水稻核心馆藏(CNAE)的541份材料的4709个SNP基因型数据,平均每68000个碱基对(pb)分布1个SNP,该密度低于水稻的平均连锁不平衡区间(约150000个碱基对)。本数据集由包含约40万个SNP的完整数据集精简而来,其特色在于标记主要针对巴西农业研究公司水稻核心馆藏中的巴西本土水稻种质资源进行基因分型,该资源构成了巴西农业研究公司水稻育种项目的核心遗传基础,与亚洲水稻的遗传基础存在显著差异。
提供机构:
Redape
创建时间:
2022-09-28
二维码
社区交流群
二维码
科研交流群
商业服务