OMIM (Online Mendelian Inheritance in Man)|遗传疾病数据集|基因数据库数据集
收藏
- OMIM项目由维克多·麦库西克博士在约翰斯·霍普金斯大学启动,旨在创建一个关于人类遗传疾病的综合数据库。
- OMIM数据库首次通过互联网向公众开放,标志着其从纸质版向电子版的重大转变。
- OMIM开始与美国国家生物技术信息中心(NCBI)合作,进一步扩展其在线访问和数据整合能力。
- OMIM数据库引入了基因组浏览器功能,使用户能够更直观地查看基因和疾病之间的关系。
- OMIM数据库进行了重大更新,增加了对基因组变异和疾病关联的详细描述,提升了其作为遗传学研究工具的价值。
- OMIM继续扩展其数据库内容,涵盖了更多罕见病和复杂疾病的遗传信息,并加强了与其他生物信息学资源的整合。
- 1OMIM.org: leveraging knowledge across phenotypes and geneticsNational Center for Biotechnology Information · 2021年
- 2The Online Mendelian Inheritance in Man (OMIM) database: linking human phenotypes to genetic informationNational Center for Biotechnology Information · 2019年
- 3OMIM: From Mendelian Disease to Complex TraitsNational Center for Biotechnology Information · 2020年
- 4OMIM: Integrating Genetics and DiseaseNational Center for Biotechnology Information · 2022年
- 5OMIM: A Comprehensive Resource for Human Genetic DisordersNational Center for Biotechnology Information · 2021年
CliMedBench
CliMedBench是一个大规模的中文医疗大语言模型评估基准,由华东师范大学等机构创建。该数据集包含33,735个问题,涵盖14个核心临床场景,主要来源于顶级三级医院的真实电子健康记录和考试练习。数据集的创建过程包括专家指导的数据选择和多轮质量控制,确保数据的真实性和可靠性。CliMedBench旨在评估和提升医疗大语言模型在临床决策支持、诊断和治疗建议等方面的能力,解决医疗领域中模型性能评估的不足问题。
arXiv 收录
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
btc
该数据集可能包含金融市场交易数据,具体包括时间戳、开盘价、最高价、最低价、收盘价和交易量等信息。数据集分为训练集,包含2465个样本,总大小为175324字节。
huggingface 收录
LibriSpeech
LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自 LibriVox 项目的已读有声读物,并经过仔细分割和对齐。
OpenDataLab 收录