five

EyeDrops

收藏
Hugging Face2025-05-18 更新2025-05-19 收录
下载链接:
https://huggingface.co/datasets/ai-chem/EyeDrops
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含化学信息的数据集,具体包括化合物的SMILES表示、名称、厘米/秒下的渗透率、对数P值、数字对象标识符、PubMed识别号、文章标题、出版商、年份、访问次数、页码和原始来源等字段。数据集的训练部分包含163个示例,总数据大小为43743字节。
创建时间:
2025-05-12
搜集汇总
数据集介绍
main_image_url
构建方式
在药物化学领域,EyeDrops数据集的构建依托于系统化的文献挖掘与数据整合流程。该数据集通过提取科学文献中的关键化合物信息,包括SMILES表示、理化性质参数如渗透系数与脂水分配系数,并结合文献元数据如DOI与PMID进行结构化存储。原始数据来源于经同行评审的学术出版物,确保了数据的可靠性与可追溯性,最终形成包含163个样本的标准化集合。
特点
该数据集的核心特点在于其多维度的化合物表征体系,不仅涵盖结构信息与物化参数,还整合了完整的文献溯源链。每个样本关联出版年份、期刊来源及访问标识,形成从分子属性到学术背景的立体描述框架。数据字段设计兼顾机器可读性与科研实用性,例如通过统一数值类型与字符串分类,支持跨平台的分析与验证需求。
使用方法
针对眼科药物研发场景,研究者可通过解析SMILES字段进行化合物结构分析,结合渗透性参数与logP值评估角膜吸收潜力。数据集支持直接加载至化学信息学工具链,利用PMID与DOI字段快速定位原始文献以深化机制研究。其标准化格式兼容主流机器学习框架,适用于构建药物渗透性预测模型或作为跨数据集基准验证的参考。
背景与挑战
背景概述
药物化学领域中眼部药物的渗透性研究对眼科治疗具有关键意义。EyeDrops数据集由AI-Chem研究团队于2023年构建,聚焦于小分子化合物经角膜渗透的动力学特性。该数据集系统整合了163种化合物的结构信息与实验测定参数,包括SMILES表征、渗透系数和脂水分配系数等关键指标,为构建药物透膜能力预测模型提供了标准化数据基础。其多源文献溯源机制通过DOI与PMID标识实现了实验数据的可验证性,显著推动了计算机辅助药物设计在眼科领域的应用深度。
当前挑战
该数据集致力于解决药物透膜能力定量预测这一核心问题,其挑战在于化合物三维构象与渗透性的非线性关系建模。数据构建过程中面临实验值标准化难题,不同文献来源的渗透系数测量存在方法学差异。稀疏数据表征构成主要瓶颈,仅163个样本需承载结构多样性需求。跨膜机制的多参数耦合要求模型同时处理极性表面积与脂溶性等竞争性因子,而生物测定数据的异质性则进一步增加了预测模型泛化能力的验证复杂度。
常用场景
经典使用场景
在药物化学领域,EyeDrops数据集作为角膜渗透性预测的关键资源,其经典应用聚焦于构建机器学习模型以评估小分子化合物的眼部给药潜力。通过整合SMILES序列、渗透系数及理化参数,研究者能够训练回归或分类算法,精准预测药物分子穿透角膜屏障的能力,为眼科药物筛选提供可靠的计算基础。
解决学术问题
该数据集有效解决了药物开发中角膜渗透性实验成本高昂、周期冗长的学术难题。通过标准化跨文献的渗透系数与分子描述符,它支持定量构效关系研究,推动计算药理学模型的可解释性发展,显著加速了眼部药物递送系统的理论探索与实验验证进程。
衍生相关工作
基于EyeDrops衍生的经典研究包括多任务图神经网络预测平台ChemX的构建,该工作融合迁移学习策略提升跨数据集泛化能力。此外,其渗透性数据常被引用至分子生成模型训练,催生出兼顾渗透性与活性的新型化合物设计范式,持续拓展计算药物化学的方法边界。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作