five

Rhea|生物化学反应数据集|代谢网络重建数据集

收藏
re3data.org2024-05-31 收录
生物化学反应
代谢网络重建
下载链接:
https://www.re3data.org/repository/r3d100010891
下载链接
链接失效反馈
资源简介:
Rhea is a freely available and comprehensive resource of expert-curated biochemical reactions. It has been designed to provide a non-redundant set of chemical transformations for applications such as the functional annotation of enzymes, pathway inference and metabolic network reconstruction. There are three types of reaction participants (reactants and products): Small molecules, Rhea polymers, Generic compounds. All three types of reaction participants are linked to the ChEBI database (Chemical Entities of Biological Interest) which provides detailed information about structure, formula and charge. Rhea provides built-in validations that ensure both mass and charge balance of the reactions. We have populated the database with the reactions found in the enzyme classification (i.e. in the IntEnz and ENZYME databases), extending it with additional known reactions of biological interest. While the main focus of Rhea is enzyme-catalysed reactions, other biochemical reactions (including those that are often termed "spontaneous") also are included.

Rhea是一项免费且全面的专业编纂生物化学反应资源。其设计宗旨在于提供一套无冗余的化学转化集,适用于酶的功能注释、途径推断以及代谢网络重建等应用。反应参与者分为三种类型(反应物与产物):小分子、Rhea聚合物、通用化合物。这三种类型的反应参与者均与ChEBI数据库(化学生物兴趣实体)相连接,该数据库提供了关于结构、化学式和电荷的详细信息。Rhea内置了验证机制,确保反应的质和电荷平衡。我们已将酶分类(即IntEnz和ENZYME数据库中的酶)中发现的反应填充至数据库中,并扩展了其中包含的生物学上已知的重要反应。尽管Rhea的主要关注点在于酶催化反应,但其他生物化学反应(包括通常被称为“自发的”反应)也被纳入其中。
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

coin_001_sample

这是一个包含180张精心拍摄的钱币图像的数据集,每张图像都采用极简摄影技术,以展示货币的视觉和触觉特性。数据集中的图像以PNG格式存储,拥有512x512的分辨率和170 dpi的清晰度,每个图像都配有至少40个文本标签。

huggingface 收录

AgiBot World

为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。

github 收录

SSBPR

SSBPR数据集是由武汉大学计算机科学学院和睡眠医学中心合作创建的,旨在通过鼾声识别睡眠体位,以辅助诊断阻塞性睡眠呼吸暂停低通气综合征(OSAHS)。该数据集包含7570条鼾声录音,涵盖六种不同的睡眠体位标签。数据收集自20名成年患者,使用高灵敏度麦克风在睡眠监测中心进行夜间录音。数据集的创建过程包括数据收集、标注和分析,其中标注工作由经验丰富的专家根据同步的PSG信号完成。SSBPR数据集的应用领域主要集中在睡眠医学,特别是OSAHS的诊断和治疗,以及特定人群如孕妇和咽喉反流病患者的睡眠体位管理。

arXiv 收录

PU Dataset

德国帕德博恩大学(PU)轴承故障诊断数据集提供了丰富的轴承故障信号数据,包括内圈、外圈和滚动体故障等多种类型的轴承故障。与其他数据集相比,PU数据集的特色在于包含了大量的电机驱动系统故障数据,为轴承故障诊断研究提供了一个全面的实验平台。

github 收录

MonkeyDoc

MonkeyDoc是一个用于文档解析的综合性数据集,由华中科技大学和金山办公共同创建。该数据集包含390万个实例,涵盖了超过十种文档类型,包括中文和英文。MonkeyDoc是迄今为止最全面的文档解析数据集,支持多任务、多领域和双语的训练与评估。数据集的构建过程包括多阶段的数据生成流程,结合了现有的公共数据集、精细的手工标注、程序化数据合成和专家模型驱动的自动标注,确保了高质量、多样性和可扩展性。MonkeyDoc旨在为文档解析模型的训练、基准测试和部署提供坚实的基础资源。

arXiv 收录