songlab/gnomad
收藏Hugging Face2025-04-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/songlab/gnomad
下载链接
链接失效反馈官方服务:
资源简介:
gnomAD变异数据集,专注于DNA变异效应预测,涉及生物学和基因组学领域。
许可证:MIT许可证
标签:
- DNA
- 变异效应预测
- 生物学
- 基因组学
# gnomAD变异数据集
如需获取更多信息,请参阅我们的[研究论文](https://www.nature.com/articles/s41587-024-02511-w)及[代码仓库](https://github.com/songlab-cal/gpn)。
## 标签说明
| 标签 | 含义 |
| ----- | ---- |
| 是(True) | 稀有单例变异(等位基因计数(Allele Count,AC)=1) |
| 否(False) | 常见变异(最小等位基因频率(Minor Allele Frequency,MAF)> 5%) |
请注意,本标签并非用于指示变异的有害性或致病性,因此不适用于分类任务。我们建议通过计算模型评分尾部的稀有变异富集度来使用该数据集。
## 使用方法
* Pandas
python
import pandas as pd
df = pd.read_parquet("hf://datasets/songlab/gnomad/test.parquet")
* Polars
python
import polars as pl
df = pl.read_parquet("https://huggingface.co/datasets/songlab/gnomad/resolve/main/test.parquet")
* Datasets
python
from datasets import load_dataset
dataset = load_dataset("songlab/gnomad", split="test")
提供机构:
songlab
原始信息汇总
gnomAD variants
标签
- dna
- variant-effect-prediction
- biology
- genomics
使用方法
-
Pandas python import pandas as pd df = pd.read_parquet("hf://datasets/songlab/gnomad/test.parquet")
-
Polars python import polars as pl df = pl.read_parquet("https://huggingface.co/datasets/songlab/gnomad/resolve/main/test.parquet")
-
Datasets python from datasets import load_dataset dataset = load_dataset("songlab/gnomad", split="test")



