five

songlab/gnomad

收藏
Hugging Face2025-04-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/songlab/gnomad
下载链接
链接失效反馈
官方服务:
资源简介:
gnomAD变异数据集,专注于DNA变异效应预测,涉及生物学和基因组学领域。

许可证:MIT许可证 标签: - DNA - 变异效应预测 - 生物学 - 基因组学 # gnomAD变异数据集 如需获取更多信息,请参阅我们的[研究论文](https://www.nature.com/articles/s41587-024-02511-w)及[代码仓库](https://github.com/songlab-cal/gpn)。 ## 标签说明 | 标签 | 含义 | | ----- | ---- | | 是(True) | 稀有单例变异(等位基因计数(Allele Count,AC)=1) | | 否(False) | 常见变异(最小等位基因频率(Minor Allele Frequency,MAF)> 5%) | 请注意,本标签并非用于指示变异的有害性或致病性,因此不适用于分类任务。我们建议通过计算模型评分尾部的稀有变异富集度来使用该数据集。 ## 使用方法 * Pandas python import pandas as pd df = pd.read_parquet("hf://datasets/songlab/gnomad/test.parquet") * Polars python import polars as pl df = pl.read_parquet("https://huggingface.co/datasets/songlab/gnomad/resolve/main/test.parquet") * Datasets python from datasets import load_dataset dataset = load_dataset("songlab/gnomad", split="test")
提供机构:
songlab
原始信息汇总

gnomAD variants

标签

  • dna
  • variant-effect-prediction
  • biology
  • genomics

使用方法

  • Pandas python import pandas as pd df = pd.read_parquet("hf://datasets/songlab/gnomad/test.parquet")

  • Polars python import polars as pl df = pl.read_parquet("https://huggingface.co/datasets/songlab/gnomad/resolve/main/test.parquet")

  • Datasets python from datasets import load_dataset dataset = load_dataset("songlab/gnomad", split="test")

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作