five

低分子PD-1阻害剤のデータセット

收藏
github2018-10-22 更新2024-05-31 收录
下载链接:
https://github.com/masahiro-mochizuki/pd1_inhibitor_dataset
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个关于低分子PD-1抑制剂的数据集,从SureChEMBL收录的专利中提取了疑似低分子PD-1抑制剂的化合物结构。根据专利描述,提取了每个专利中活性最高的化合物,如果活性仅以等级给出且无法确定最高活性化合物,则从最高活性等级中选择编号最小的代表性实施例。对于SureChEMBL未收录或结构有误的化合物,通过OCR和手动输入的方式进行了结构输入。

This dataset pertains to low molecular weight PD-1 inhibitors, comprising compound structures extracted from patents cataloged in SureChEMBL that are suspected to be low molecular weight PD-1 inhibitors. Based on patent descriptions, the most active compound from each patent was extracted. In cases where activity was only indicated by rank and the most active compound could not be definitively identified, the representative example with the lowest number from the highest activity rank was selected. For compounds not included in SureChEMBL or with erroneous structures, the structures were inputted using OCR and manual entry methods.
创建时间:
2018-10-21
原始信息汇总

数据集概述

数据集名称

A dataset of PD-1 inhibitors

数据集内容

本数据集包含从SureChEMBL收录的专利中提取的疑似低分子PD-1抑制剂的低分子化合物结构。每个专利中,基于描述提取了被认为活性最高的化合物一例。若活性仅以等级给出且无法确定最高活性化合物,则从最高活性等级中选取代表实施例编号最小的化合物。对于SureChEMBL中未收录或疑似错误的结构信息,通过OCR技术并辅以手动输入进行补充。

数据集注意事项

  • 不保证数据集的准确性。
  • 不保证此数据集涵盖了所有公开的专利信息。
  • 不对因使用此数据集而产生的任何损害负责。

数据集字段说明

字段名 说明
compound_id 为工作分配的化合物ID
patent_no 专利号
example_no 代表实施例/化合物编号
schembl_id 该化合物在SureChEMBL的ID,找不到则为空
applicant 申请组织
smiles 化合物的SMILES表示
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建是基于SureChEMBL数据库中收录的专利信息,从中筛选出被认为是低分子PD-1抑制剂的化合物结构。通过分析专利描述,选取了每个专利中活性最高的化合物作为代表,若无法确定具体最高活性化合物,则选取该活性级别中最年轻的代表实施例。对于SureChEMBL中未收录或存在结构错误的情况,通过OCR技术及人工手动方式输入结构信息。
使用方法
用户在使用该数据集时,应当注意数据集可能存在的准确性问题,并结合自身的研发需求进行相应的验证。在利用数据集进行药物研发或相关研究时,应遵守Creative Commons BY 4.0许可协议,并在参加如'创药レイドバトル 2018'等活动时,按照主办方的要求声明使用本数据集。
背景与挑战
背景概述
低分子PD-1阻害剤のデータセット,是一个专门针对PD-1抑制剂的研究数据集。该数据集由SureChEMBL专利数据库中抽取而出,旨在为药物研发领域提供有关低分子PD-1抑制剂的结构信息。该数据集的创建,源于对PD-1/PD-L1蛋白质相互作用抑制剂专利信息的深度挖掘,其创建时间为2018年,由参与創薬レイドバトル2018的活动者所整理。该数据集的核心研究问题是识别和筛选出具有高活性的PD-1抑制剂,对相关领域的研究具有重要的参考价值。
当前挑战
尽管该数据集为PD-1抑制剂的研究提供了宝贵的信息,但在使用过程中也存在一些挑战。首先,数据集的准确性无法得到保证,可能存在由于手动输入或OCR识别导致的错误。其次,数据集并未涵盖所有公开的专利信息,可能遗漏了一些重要的抑制剂结构。此外,数据集在使用过程中可能导致的任何损失,开发者不承担任何责任。这些都是研究人员在使用该数据集时需要考虑的问题。
常用场景
经典使用场景
在药物设计与开发领域,低分子PD-1阻害剤のデータセット作为含有潜在PD-1抑制剂低分子化合物的结构信息集合,被广泛用于研究和筛选新型免疫检查点抑制剂。该数据集通过整理SureChEMBL数据库中的专利信息,提取出被认为具有高活性的化合物结构,为科研人员提供了一个宝贵的研究资源。
解决学术问题
该数据集解决了在PD-1/PD-L1通路研究中,如何高效获取和利用抑制剂结构信息的问题。它为研究人员提供了活性化合物的结构数据,有助于理解PD-1抑制剂的活性机制,促进新型药物分子的设计与优化,对推动肿瘤免疫治疗领域的研究具有重要意义。
实际应用
实际应用中,该数据集可被药物研发企业用于新药筛选,通过分析数据集中的化合物结构,设计出具有更高亲和力和选择性的PD-1抑制剂。同时,它也为教育机构提供了教学案例,帮助学生和研究人员理解药物设计的基本原理。
数据集最近研究
最新研究方向
在免疫肿瘤学领域,低分子PD-1阻害剤的数据集为研究者提供了一种珍贵的资源。近期研究集中于利用该数据集进行药物设计与筛选,以发现新型高效的PD-1/PD-L1相互作用阻害剂。通过数据集中的化合物结构信息,科研人员可以深入探索PD-1/PD-L1通路在肿瘤免疫逃逸中的作用机制,进而为癌症治疗提供新的策略。此数据集的开放,不仅推动了相关专利信息的共享,也为药物研发领域的创新提供了动力,具有重大的学术价值和临床应用潜力。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务