five

OMIM (Online Mendelian Inheritance in Man)|遗传疾病数据集|基因数据库数据集

收藏
www.omim.org2024-10-23 收录
遗传疾病
基因数据库
下载链接:
https://www.omim.org/
下载链接
链接失效反馈
资源简介:
OMIM是一个包含人类基因和遗传疾病信息的在线数据库。它提供了详细的遗传疾病描述、基因定位、相关文献和临床信息。数据集内容包括疾病名称、基因名称、基因定位、遗传模式、临床特征、相关文献引用等。
提供机构:
www.omim.org
AI搜集汇总
数据集介绍
main_image_url
构建方式
OMIM(Online Mendelian Inheritance in Man)数据集的构建基于对人类遗传疾病的系统性编目。该数据集通过整合来自全球的遗传学研究成果,包括基因突变、疾病表型及其遗传模式,形成了一个详尽的遗传疾病数据库。构建过程中,研究人员对每种疾病进行了详细的描述,包括其临床特征、遗传机制、相关基因及其突变信息。此外,OMIM还通过与PubMed等生物医学文献数据库的链接,提供了丰富的文献支持,确保了数据的权威性和时效性。
使用方法
OMIM数据集主要用于遗传学研究、临床诊断和教育培训。研究人员可以利用该数据集进行基因与疾病关联分析,探索新的遗传机制。临床医生则可以通过查询OMIM,获取特定遗传病的详细信息,辅助诊断和治疗决策。教育工作者和学生也可以利用OMIM进行遗传学知识的教学和学习。使用OMIM时,用户可以通过其在线搜索功能,输入疾病名称或基因符号,快速获取相关信息。此外,OMIM还提供了API接口,方便开发者集成到自己的应用程序中,进一步扩展其应用范围。
背景与挑战
背景概述
OMIM(Online Mendelian Inheritance in Man)数据集,自1966年由Victor A. McKusick博士创建以来,已成为遗传学领域的重要资源。该数据集详细记录了人类基因和遗传疾病的遗传基础,涵盖了数千种遗传性状和疾病。OMIM不仅为研究人员提供了丰富的遗传信息,还促进了基因诊断和个性化医疗的发展。其持续的更新和扩展,使其在遗传学研究中具有不可替代的地位,对推动遗传疾病的理解和治疗具有深远影响。
当前挑战
尽管OMIM数据集在遗传学领域具有重要地位,但其构建和维护过程中仍面临诸多挑战。首先,随着基因组学技术的快速发展,数据量呈指数级增长,如何高效管理和更新这些数据成为一个重大挑战。其次,遗传疾病的复杂性和多样性使得数据的标准化和分类变得困难,需要不断优化数据结构和算法。此外,数据隐私和伦理问题也是OMIM必须面对的重要议题,确保数据的安全性和合规性是持续发展的关键。
发展历史
创建时间与更新
OMIM(Online Mendelian Inheritance in Man)数据集创建于1966年,由Victor A. McKusick博士发起,旨在系统地记录人类遗传疾病及其相关基因。该数据集自创建以来持续更新,最新版本于2023年发布,确保了信息的时效性和准确性。
重要里程碑
OMIM数据集的重要里程碑包括1987年实现在线访问,极大地提高了全球科研人员获取遗传信息的便利性。2000年,OMIM与美国国家生物技术信息中心(NCBI)合作,进一步整合了基因组数据,增强了数据集的全面性和可访问性。此外,OMIM在2010年引入了基因组注释功能,使得用户能够更深入地理解基因与疾病之间的关系。
当前发展情况
当前,OMIM数据集已成为遗传学和基因组学研究的核心资源,为全球科研人员提供了详尽的遗传疾病信息和基因注释。其与NCBI的紧密合作,使得数据集能够实时更新,并与其他生物信息数据库无缝对接,极大地促进了跨学科研究的发展。OMIM的持续发展不仅推动了遗传疾病的诊断和治疗,还为个性化医疗和精准医学的发展提供了坚实的基础。
发展历程
  • OMIM项目由维克多·麦库西克博士在约翰斯·霍普金斯大学启动,旨在创建一个关于人类遗传疾病的综合数据库。
    1960年
  • OMIM数据库首次通过互联网向公众开放,标志着其从纸质版向电子版的重大转变。
    1987年
  • OMIM开始与美国国家生物技术信息中心(NCBI)合作,进一步扩展其在线访问和数据整合能力。
    1995年
  • OMIM数据库引入了基因组浏览器功能,使用户能够更直观地查看基因和疾病之间的关系。
    2000年
  • OMIM数据库进行了重大更新,增加了对基因组变异和疾病关联的详细描述,提升了其作为遗传学研究工具的价值。
    2010年
  • OMIM继续扩展其数据库内容,涵盖了更多罕见病和复杂疾病的遗传信息,并加强了与其他生物信息学资源的整合。
    2020年
常用场景
经典使用场景
在遗传学领域,OMIM(Online Mendelian Inheritance in Man)数据集被广泛用于研究单基因遗传病的遗传机制。该数据集详细记录了人类基因及其相关的遗传疾病,为科学家提供了丰富的遗传信息资源。通过OMIM,研究人员可以深入分析特定基因突变与疾病表型之间的关系,从而推动遗传病的诊断和治疗研究。
解决学术问题
OMIM数据集在解决遗传学领域的多个学术问题上发挥了关键作用。它不仅帮助科学家识别和分类单基因遗传病,还促进了基因型-表型关系的研究。通过OMIM,研究人员能够追踪特定基因的历史和功能,揭示其在疾病发生中的作用,从而为遗传病的预防和治疗提供了理论基础。
实际应用
在实际应用中,OMIM数据集被广泛用于临床遗传学诊断和咨询。医生和遗传学家利用OMIM中的信息,为患者提供个性化的遗传咨询和诊断服务。此外,OMIM还支持药物开发和基因治疗的研究,通过识别潜在的治疗靶点,加速新药的研发进程。
数据集最近研究
最新研究方向
在遗传学领域,OMIM(Online Mendelian Inheritance in Man)数据集的最新研究方向主要集中在利用深度学习和人工智能技术来解析复杂遗传疾病的分子机制。研究人员通过整合OMIM中的基因型-表型数据,结合大规模基因组测序结果,构建预测模型,以期提高罕见病和复杂疾病的诊断准确性。此外,OMIM数据集还被广泛应用于基因治疗和个性化医疗的研究中,通过分析患者的遗传信息,制定更为精准的治疗方案。这些前沿研究不仅推动了遗传学的发展,也为临床医学提供了新的工具和方法。
相关研究论文
  • 1
    OMIM.org: leveraging knowledge across phenotypes and geneticsNational Center for Biotechnology Information · 2021年
  • 2
    The Online Mendelian Inheritance in Man (OMIM) database: linking human phenotypes to genetic informationNational Center for Biotechnology Information · 2019年
  • 3
    OMIM: From Mendelian Disease to Complex TraitsNational Center for Biotechnology Information · 2020年
  • 4
    OMIM: Integrating Genetics and DiseaseNational Center for Biotechnology Information · 2022年
  • 5
    OMIM: A Comprehensive Resource for Human Genetic DisordersNational Center for Biotechnology Information · 2021年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Alexa Domains

该数据集由前 100 万个网站的 URL 组成。 域名使用 Alexa 流量排名进行排名 是使用浏览行为的组合来确定的 网站上的用户数、唯一身份访问者的数量和网页浏览量。更详细地说,唯一身份访问者是 在给定日期访问网站的唯一用户数, 和 pageviews 是用户 URL 请求的总数 网站。但是,对同一网站的多个请求 在同一天被计为一次综合浏览量。网站 独立访问者和综合浏览量的最高组合 排名最高

OpenDataLab 收录

AgiBot World

为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。

github 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

中国地质调查局: 全国1∶200 000区域水文地质图空间数据库

全国1∶200 000区域水文地质图空间数据库以建国后在全国范围内(本次未在香港特别行政区、澳门特别行政区和台湾省开展工作) 30个省开展的1∶200 000区域水文地质普查工作所取得的区域水文地质普查报告、综合水文地质图等地质资料为数据源,在制定的“1∶200 000区域水文地质图空间数据库图层及属性文件格式标准”的基础上,建成了一个全国性的、大型的区域水文地质学空间数据库。该数据库总共采集、处理了全国范围内1∶200 000图幅的<number>1 017</number>幅全要素综合水文地质图信息,全部数据量约50 GB。数据库涵盖了以1∶200 000国际标准图幅为管理单位的水文地质要素空间数据图层,内容包括:地理要素(交通层、水系层、行政区划层等),基础地质要素(地层分区层、断裂构造层),水文地质要素(地下水类型层、地下水富水性层、地下水迳流模数层,地下水水质层、水文地质特征层、地下水利用规划层),专题要素(综合水文地质柱状图,水文地质剖面图) 四大类近30个要素图层。空间数据库主要采用MapGIS地理信息系统格式存储,形成了目前国内覆盖范围最广、包含信息最完整的区域水文地质图空间数据库成果,是地质领域全国性最重要的基础信息资源之一。

DataCite Commons 收录