five

标准化化学和生物基准公开数据集

收藏
国家基础学科公共科学数据中心2026-01-30 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=67d51182195d260905af9fdd&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
数据集公开了四种类型不同的化学和生物数据,用于验证所提出方法的有效性。这些数据集经过项目团队的处理和优化,以更好地适配图神经网络(GNN)在光谱效应与图卷积滤波设计中的研究需求。具体数据集如下: NCI1数据集:数据集源自化学信息学领域,每个图表示一个化学化合物,节点代表原子,边代表原子间的化学键。NCI1数据集用于非小细胞肺癌的活性筛选。在本项目中,我们对该数据集进行了光谱平滑性优化,以验证所提出的“无相关架构”在处理光谱不平滑问题时的有效性。 NCI109数据集:数据集源自化学信息学领域,每个图表示一个化学化合物,节点代表原子,边代表原子间的化学键。NCI109数据集用于卵巢癌细胞的活性筛选。每个节点都有一个输入标签,表示对应的原子类型,通过独热编码(one-hot encoding)转换为0/1元素的向量。项目中,我们对该数据集的光谱特征进行了重新标定,以支持更复杂的图滤波器设计。 ENZYMES数据集:数据集包含了酶的蛋白质结构图。每个图代表一种酶,节点表示二级结构元素,如螺旋、片层或转角,并附有物理和化学信息。在本项目中,我们对该数据集的光谱分布进行了优化,以验证所提出的光谱优化方法在多通道图卷积中的性能提升。 PTC_MR数据集:PTC数据集用于预测化学化合物的致癌性。其中,PTC_MR是该数据集的一个子集,包含了化学化合物的分子图,节点代表原子,边代表化学键。该数据集的标签表示化合物对雄性大鼠的致癌性。项目中,我们对该数据集的光谱范围进行了调整,以支持更高阶多项式滤波器的设计与验证。
提供机构:
大连理工大学
二维码
社区交流群
二维码
科研交流群
商业服务