bioR_tasks|基因变异分析数据集|生物信息学数据集
收藏数据集概述
数据集名称
bioR_tasks
数据集配置
1. variant_effect_causal_eqtl
- 特征:
- ref_forward_sequence: string
- alt_forward_sequence: string
- tissue: string
- chromosome: string
- label: string
- 数据划分:
- train: 89,060 个样本,733,222,918 字节
- test: 8,862 个样本,72,960,623 字节
- 下载大小: 222,889,395 字节
- 数据集大小: 806,183,541 字节
2. variant_effect_pathogenic_clinvar
- 特征:
- label: string
- chromosome: string
- ref_forward_sequence: string
- alt_forward_sequence: string
- gene: string
- gene_name: string
- disease: string
- 数据划分:
- train: 48,850 个样本,404,403,297 字节
- test: 1,233 个样本,10,198,075 字节
- 下载大小: 101,233,780 字节
- 数据集大小: 414,601,372 字节
3. varient_effect_causal_eqtl
- 特征:
- ref_forward_sequence: string
- alt_forward_sequence: string
- label: string
- 数据划分:
- train: 89,060 个样本,730,737,300 字节
- test: 8,862 个样本,72,712,710 字节
- 下载大小: 222,738,574 字节
- 数据集大小: 803,450,010 字节
4. varient_effect_clinvar
- 特征:
- ref_forward_sequence: string
- alt_forward_sequence: string
- label: string
- 数据划分:
- train: 38,634 个样本,316,991,970 字节
- test: 1,018 个样本,8,352,690 字节
- 下载大小: 100,769,148 字节
- 数据集大小: 325,344,660 字节
5. varient_effect_pathogenic_omim
- 特征:
- ref_forward_sequence: string
- alt_forward_sequence: string
- chromosome: string
- label: string
- 数据划分:
- test: 2,321,473 个样本,19,071,873,567 字节
- 下载大小: 4,127,853,757 字节
- 数据集大小: 19,071,873,567 字节

LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
中国省级灾害统计空间分布数据集(1999-2020年)
该数据集为中国省级灾害统计空间分布数据集,时间为1999-2020年。该数据集包含中国各省自然灾害、地质灾害、地震灾害、森林火灾、森林病虫鼠害、草原灾害六类灾害的详细数据。数据量为206MB,数据格式为excel。
国家地球系统科学数据中心 收录
中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录
Subway Dataset
该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。
www.kaggle.com 收录