HMP (Human Microbiome Project)|微生物组数据集|基因测序数据集
收藏
- 美国国立卫生研究院(NIH)宣布启动人类微生物组计划(HMP),旨在研究人体微生物群落及其与健康和疾病的关系。
- HMP项目正式启动,开始招募志愿者并收集样本,以构建人体微生物组的标准化数据库。
- HMP发布了第一阶段的研究成果,包括对18个人体部位的微生物组分析,揭示了微生物群落的多样性和功能。
- HMP项目进入第二阶段,重点研究微生物组在疾病状态下的变化,特别是与肥胖、糖尿病和炎症性肠病等疾病的关系。
- HMP发布了第二阶段的研究成果,提供了关于微生物组在疾病中的作用及其潜在治疗策略的深入见解。
波士顿房价数据集
波士顿房价数据集是一个经典的机器学习数据集,通常用于回归任务,尤其是房价预测。下方文档中有所有字段顺序的描述。
阿里云天池 收录
giovannidemuri__sharegpt-ex50000-seed5_llama8b-er-v573-seed2-hx_256_ngt0.7_tp0.9
该数据集包含了用户与助手之间的对话,其中包含两个字段:用户发言和助手回应,均为字符串类型。训练集大小为38646852字节,共有44096条对话记录。
huggingface 收录
Materials Project 在线材料数据库
Materials Project 是一个由伯克利加州大学和劳伦斯伯克利国家实验室于 2011 年共同发起的大型开放式在线材料数据库。这个项目的目标是利用高通量第一性原理计算,为超过百万种无机材料提供全面的性能数据、结构信息和计算模拟结果,以此加速新材料的发现和创新过程。数据库中的数据不仅包括晶体结构和能量特性,还涵盖了电子结构和热力学性质等详尽信息,为研究人员提供了丰富的材料数据资源。相关论文成果为「Commentary: The Materials Project: A materials genome approach to accelerating materials innovation」。
超神经 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
NIST Thermochemical Database
NIST Thermochemical Database(NIST热化学数据库)是一个包含大量热化学数据的数据集,涵盖了各种化学物质的热力学性质,如焓、熵、自由能等。该数据库由美国国家标准与技术研究院(NIST)维护,旨在为科学研究和工业应用提供准确的热化学数据。
webbook.nist.gov 收录