five

SHREC21 cryo-ET track dataset

收藏
github2024-07-30 更新2024-08-02 收录
下载链接:
https://github.com/McHaillet/shrec21_cryo-et_scripts
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含用于生成SHREC21 cryo-ET track的脚本,涉及从模拟到实际生成的详细步骤,包括依赖项、文件路径、电势生成、膜泡生成和断层扫描模拟等。

This dataset contains scripts for generating the SHREC21 cryo-ET track, covering detailed steps from simulation to actual generation, including dependencies, file paths, electrostatic potential generation, vesicle generation, and tomography simulation.
创建时间:
2024-07-30
原始信息汇总

SHREC21 cryo-ET 数据集生成

依赖项

  • 需要安装 PyTOM。具体来说,生成 SHREC21 数据集需要使用特定版本的 PyTOM,即 commit: master da64c6f

文件路径说明

  • 部分脚本包含硬编码路径,需要更新这些路径:
    • 从输入结构文件夹模拟断层图:/path/to/pytom/simulation/MicrographModeller.py
    • 生成静电势(实部和虚部):/path/to/pytom/simulation/potential.py
    • 生成囊泡静电势:/path/to/pytom/simulation/membrane.py
  • 访问数据还需要以下路径:
    • 用于采样囊泡的小型 MD 平衡膜片:/path/to/pytom/simulation/membrane_models/dppc128.pdb
    • K2 探测器数据,DQE 和 MTF:/path/to/pytom/simulation/detectors/

生成静电势

  • 进入静电势计算文件夹:

    cd potential/

  • 更新 call_potential.py 脚本中的正确路径,并下载所有原子模型(PDB)并放置在 pdb/ 文件夹中。运行脚本:

    python call_potential.py

  • 输出文件包含每个 PDB 的 MRC 文件,需将其移动到 potential/ 文件夹中。

生成囊泡

  • 为模拟生成膜囊泡,运行以下命令(需设置正确路径):

    pytom /path/to/pytom/simulation/membrane.py --radius_factor 4 --spacing 5 -d potential/ --membrane_pdb /path/to/pytom/simulation/membrane_models/dppc128.pdb -x -v 300 --cores 4

  • 膜模拟耗时长,内存需求高,取决于囊泡大小。--radius_factor 决定囊泡大小,默认值 1 生成约 45nm 直径的囊泡。SHREC21 生成 3 个 --radius-factor 为 4 的囊泡和 2 个 --radius-factor 为 6 的囊泡。

  • 生成后需将 bilayer_5.00A_...x...x...nm 重命名为 v1-v5

运行断层图模拟

  • 首先,SHREC21 将模拟倾斜系列缩放到 EMPIAR-10064 的实验图像功率谱,需下载并放置在 scaling_examples/ 文件夹中。

  • 进入 shrec_models 目录:

    cd shrec_models/

  • 更新 simulator.sh 文件中的路径,然后运行模拟:

    simulator.sh model_0.conf

  • 默认使用 3 个 CPU 核心,需要大量内存(约 200 GB)。可以减少核心数,但单核运行仍需 60 GB。

搜集汇总
数据集介绍
main_image_url
构建方式
在构建SHREC21 cryo-ET track数据集的过程中,首先依赖于PyTOM软件的特定版本,通过模拟电子显微镜图像生成技术,对蛋白质结构进行详细的模拟。具体步骤包括生成电势场、构建膜状结构以及最终的断层扫描模拟。电势场的生成通过调用`call_potential.py`脚本实现,该脚本需预先下载并处理PDB数据库中的原子模型。膜状结构的生成则通过`membrane.py`脚本,根据设定的半径因子和间距参数,生成不同尺寸的膜状结构。最后,通过`simulator.sh`脚本进行断层扫描模拟,生成最终的电子显微镜图像数据。
使用方法
使用SHREC21 cryo-ET track数据集时,用户需首先确保安装了特定版本的PyTOM软件,并根据README文件中的指引,更新相关脚本中的路径信息。具体使用步骤包括:生成电势场、构建膜状结构、进行断层扫描模拟,并最终生成电子显微镜图像数据。用户可以通过调用相应的Python脚本和Shell脚本,按照预设的参数进行数据生成。生成的数据可用于训练和验证电子显微镜图像处理算法,以及进行相关领域的科学研究。
背景与挑战
背景概述
SHREC21 cryo-ET track dataset是由SBC-Utrecht机构的研究团队创建的,旨在推动低温电子断层扫描(cryo-ET)技术的发展。该数据集的构建基于PyTOM软件,专注于模拟和生成复杂的生物分子结构的三维图像。其核心研究问题在于如何通过模拟技术提高cryo-ET图像的分辨率和准确性,从而为生物医学研究提供更精确的数据支持。该数据集的发布不仅为cryo-ET领域的研究者提供了宝贵的资源,还推动了相关算法和技术的进步,具有重要的学术和应用价值。
当前挑战
SHREC21 cryo-ET track dataset在构建过程中面临多项挑战。首先,模拟生物分子结构的三维图像需要高度复杂的计算和大量的内存资源,尤其是在生成和处理大型数据集时。其次,数据集的生成依赖于PyTOM软件的特定版本和配置,这要求研究者具备高水平的编程和系统配置能力。此外,数据集的生成过程中涉及多个步骤,如电势计算、膜囊生成和断层扫描模拟,每一步都需要精确的路径设置和参数调整,增加了数据集构建的复杂性。最后,数据集的生成还需要大量的实验数据支持,如EMPIAR-10064的实验图像,这增加了数据集构建的时间和成本。
常用场景
经典使用场景
在冷冻电子断层扫描(cryo-ET)领域,SHREC21 cryo-ET track dataset 数据集被广泛用于模拟和分析生物大分子在细胞内的三维结构。该数据集通过模拟不同尺寸的膜泡和蛋白质复合物的电势分布,生成了一系列高质量的模拟断层图像。这些图像不仅为研究人员提供了丰富的实验数据,还为算法开发和优化提供了基准。通过使用该数据集,研究者能够评估和改进现有的图像处理和结构解析算法,从而提高对复杂生物系统的理解。
解决学术问题
SHREC21 cryo-ET track dataset 数据集解决了冷冻电子断层扫描技术中长期存在的几个关键学术问题。首先,它通过提供高质量的模拟数据,帮助研究人员克服了实验数据获取的困难和成本问题。其次,该数据集为算法开发和验证提供了标准化的测试平台,促进了图像处理和结构解析技术的进步。此外,通过模拟不同尺寸和形状的膜泡,该数据集还为研究细胞内生物大分子的分布和相互作用提供了新的视角,推动了生物物理学和结构生物学的发展。
实际应用
在实际应用中,SHREC21 cryo-ET track dataset 数据集被广泛用于开发和优化冷冻电子断层扫描技术中的图像处理和结构解析算法。例如,生物医学研究机构利用该数据集来改进图像重建算法,以提高对病毒和细胞器的结构解析精度。此外,制药公司也利用该数据集来评估和优化药物靶点的识别算法,从而加速新药的研发进程。通过这些应用,该数据集不仅提升了科学研究的效率,还为实际的生物医学应用提供了强有力的支持。
数据集最近研究
最新研究方向
在冷冻电镜(cryo-ET)领域,SHREC21 cryo-ET track数据集的最新研究方向主要集中在提高三维重构的精度和效率。该数据集通过模拟真实生物样本的电子断层扫描图像,为研究人员提供了一个标准化的测试平台。前沿研究包括优化模拟算法,以更准确地再现生物分子的复杂结构,以及开发新的图像处理技术,以提高数据处理的效率和准确性。此外,结合深度学习方法,研究人员正在探索如何利用神经网络自动识别和分类不同的生物分子结构,从而推动冷冻电镜技术在生物医学研究中的应用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作