five

FlexiSol

收藏
github2025-10-27 更新2025-10-28 收录
下载链接:
https://github.com/grimme-lab/flexisol
下载链接
链接失效反馈
官方服务:
资源简介:
FlexiSol是首个结合结构和功能复杂、高度柔性溶质与详尽构象采样的柔性溶剂化基准数据集,用于系统测试溶剂化模型。

FlexiSol is the first flexible solvation benchmark dataset that integrates structurally and functionally complex, highly flexible solutes as well as exhaustive conformational sampling, for systematic testing of solvation models.
创建时间:
2025-09-29
原始信息汇总

FlexiSol 数据集概述

数据集基本信息

  • 数据集名称:FlexiSol
  • 性质:柔性溶剂化基准数据集
  • 特点:首个结合结构和功能复杂、高度柔性溶质与详尽构象采样的溶剂化模型测试数据集
  • DOI:10.1039/D5SC06406F
  • 许可证:MIT

数据集结构

flexisol/ # 基准数据(结构文件,按方法分类的文件夹) ├─ data/ │ ├─ raw_energies/ # 包含能量的CSV文件(用于populate命令) │ ├─ references/ # 实验参考数据(CSV格式) │ └─ results/ # 已发布的原始结果(CSV格式) ├─ output/ # 评估生成的CSV文件

数据内容

  • 能量文件:每个方法文件夹下包含el_energysolv_energy文件
  • 数据类型:包含溶剂化自由能(gsolv)和pKa值(pkab)数据
  • 数据规模:基准测试包含824行数据(gsolv=530,pkab=294)

评估功能

主要命令

  • evaluate-all(别名all):分析多个方法
  • evaluate-one(别名one):分析单个方法
  • populate:将CSV中的能量复制到预期文件夹结构

评估选项

  • 加权方法-w参数):
    • boltzmann:玻尔兹曼加权平均(默认,298.15 K)
    • minimum:选择构象间最小能量
  • 几何结构-g参数):
    • full:气相声子用于气相模式,溶剂化几何用于溶剂化模式(默认)
    • gas:两种模式均使用气相声子
    • solv:两种模式均使用溶剂化几何

误差指标

  • 平均误差(ME)
  • 平均绝对误差(MAE)
  • 均方根误差(RMSE)
  • 标准偏差(SD)
  • 最大绝对误差(AMAX)
  • 数据点计数(N)

异常值过滤

  • 绝对截断:移除参考值绝对值>200的数据点
  • Sigma截断:移除误差绝对值>3个标准偏差的数据点

使用方法

  1. 安装flexisol-cli工具
  2. 设置基准数据集路径(通过--benchmark-root参数或FLEXISOL_ROOT环境变量)
  3. 使用flexisol populate准备数据
  4. 运行flexisol allflexisol one进行评估分析
搜集汇总
数据集介绍
main_image_url
构建方式
在计算化学领域,FlexiSol数据集通过整合分子构象集合与溶剂化模型评估需求,构建了首个结合结构复杂性与功能多样性的柔性溶剂化基准集。该数据集采用系统化方法收集了高度柔性溶质的构象样本,涵盖气相与溶剂化状态下的能量数据,并通过标准化文件结构组织原始能量文件与实验参考值,确保数据的一致性与可追溯性。
使用方法
用户可通过命令行工具快速调用数据集功能,执行批量或单方法分析。典型流程包括通过populate命令导入能量数据,利用evaluate-all或evaluate-one命令结合权重参数与几何设置进行溶剂化自由能或pKa计算。工具自动生成结构化输出文件,并集成误差统计与可视化进度提示,显著简化了溶剂化模型的系统性验证流程。
背景与挑战
背景概述
FlexiSol数据集由Grimme实验室于2025年创建,作为首个结合结构功能复杂性与构象采样的柔性溶剂化基准集,填补了溶剂化模型系统验证的空白。该数据集通过整合高度柔性溶质的构象系综,支持对溶剂自由能(gsolv)和酸解离常数(pkab)的精确评估,其创新性体现在将量子化学计算与实验数据耦合,为计算化学领域提供了前所未有的标准化测试平台。
当前挑战
FlexiSol致力于解决溶剂化模型在复杂柔性分子体系中的预测精度问题,其核心挑战包括:如何准确描述构象依赖的溶剂化效应,以及平衡计算效率与量子化学精度。在构建过程中,需克服大规模构象采样带来的计算资源消耗,并确保不同溶剂化方法(如SMD、ALPB)的能量数据与实验参考值的一致性,同时需处理构象权重分配(玻尔兹曼与最小值选择)对统计结果的敏感性影响。
常用场景
经典使用场景
在计算化学领域,FlexiSol数据集作为首个结合结构复杂性与构象采样的溶剂化基准集,其经典应用场景聚焦于系统评估溶剂化模型的准确性。通过整合高度柔性溶质分子的构象集合,该数据集支持对气相和溶剂化相能量的加权计算,为研究人员提供了验证量子化学方法在复杂分子体系中预测能力的标准化平台。
解决学术问题
FlexiSol有效解决了溶剂化自由能和pKa预测中因分子构象多样性导致的模型偏差问题。通过引入玻尔兹曼加权与构象最小能量选择机制,该数据集显著提升了溶剂化模型在热力学性质计算中的可靠性,填补了传统基准集在柔性分子系统评估方面的空白,推动了计算溶剂化领域方法学的标准化进程。
实际应用
该数据集在药物设计与材料科学中具有重要应用价值。研究人员可利用其评估不同溶剂化模型对候选药物分子溶解性及酸碱性的预测精度,为高通量虚拟筛选提供理论依据。同时,在新型电解质材料开发中,FlexiSol能辅助优化离子溶剂化能的计算流程,加速功能材料的理性设计。
数据集最近研究
最新研究方向
在计算化学领域,FlexiSol数据集作为首个结合结构功能复杂性与柔性分子构象采样的溶剂化基准集,正推动溶剂化模型评估范式的革新。前沿研究聚焦于利用其构象加权策略与多尺度几何处理,系统解析溶剂效应对分子性质的影响机制。该数据集通过整合实验参考值与量子化学计算数据,为机器学习驱动的溶剂化能预测模型提供了关键验证平台,显著提升了pKa与溶剂化自由能计算的可靠性,在药物设计与材料开发中展现出重要应用价值。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作