five

Transitive prediction of small molecule function through alignment of high-content screening resources

收藏
NIAID Data Ecosystem2026-05-02 收录
下载链接:
https://figshare.com/articles/dataset/Transitive_prediction_of_small_molecule_function_through_alignment_of_high-content_screening_resources/27756177
下载链接
链接失效反馈
官方服务:
资源简介:
# Datasets used in Transitive prediction of small molecule function through alignment of high-content screening resources This dataset supports the development of CLIPn, a contrastive-learning framework designed to align heterogeneous high-content screening (HCS) profile datasets. ***GitHub link:*** https://github.com/AltschulerWu-Lab/CLIPn ## Directory Structure ### Data Files - **HCS_datasets.pkl**: Contains 13 high-content screening (HCS) datasets from multiple studies across 20 years. - **Hypoxia.pkl**: Contains 8 profile datasets using different assays and treated under diverse hypoxia durations. - **Expression.pkl**: Contains 2 transcriptional profile datasets and 6 image profile datasets for multimodal analysis. ### Folders #### raw_profiles ##### HCS13/ - Contains raw data from 13 high-content screening (HCS) datasets. Each dataset includes meta and feature files. ##### L1000/ - **CDRP_feature_exp.csv**: Raw L1000 expression data from the CDRP dataset. - **CDRP_meta_exp.csv**: Metadata associated with the CDRP expression data. - **LINCS_feature_exp.csv**: Raw L1000 expression data from the LINCS dataset. - **LINCS_meta_exp.csv**: Metadata associated with the LINCS expression data. ##### RxRx3/ - **RxRx3_feature_final.csv**: Profile data from the RxRx3 dataset. - **RxRx3_meta_final.csv**: Metadata from the RxRx3 dataset. ##### Uncharacterized_compounds/ - **NCI_cpnData.csv**: Feature data for uncharacterized compounds from the NCI dataset. - **NCI_cpnInfo.csv**: Information about uncharacterized compounds in the NCI dataset. - **Prestwick_UTSW_cpnData.csv**: Feature data for uncharacterized compounds from the Prestwick UTSW dataset. - **Prestwick_UTSW_cpnInfo.csv**: Information about uncharacterized compounds from the Prestwick UTSW dataset.

# 基于高内涵筛选(high-content screening, HCS)资源对齐的小分子功能传递预测研究所用数据集 本数据集用于支撑CLIPn的开发,CLIPn是一种专为对齐异构高内涵筛选(HCS)数据集而设计的对比学习框架。 ***GitHub 链接:*** https://github.com/AltschulerWu-Lab/CLIPn ## 目录结构 ### 数据文件 - **HCS_datasets.pkl**:包含20年来多项研究的13个高内涵筛选(HCS)数据集。 - **Hypoxia.pkl**:包含8个采用不同实验方法、在不同缺氧时长下处理得到的画像数据集。 - **Expression.pkl**:包含2个转录组画像数据集与6个图像画像数据集,用于多模态分析。 ### 文件夹 #### 原始画像数据集 ##### HCS13/ - 包含13个高内涵筛选(HCS)数据集的原始数据,每个数据集均包含元数据文件与特征文件。 ##### L1000/ - **CDRP_feature_exp.csv**:来自CDRP数据集的原始L1000表达数据。 - **CDRP_meta_exp.csv**:与CDRP表达数据相关的元数据。 - **LINCS_feature_exp.csv**:来自LINCS数据集的原始L1000表达数据。 - **LINCS_meta_exp.csv**:与LINCS表达数据相关的元数据。 ##### RxRx3/ - **RxRx3_feature_final.csv**:来自RxRx3数据集的画像数据。 - **RxRx3_meta_final.csv**:来自RxRx3数据集的元数据。 ##### Uncharacterized_compounds/ - **NCI_cpnData.csv**:来自NCI数据集的未表征化合物特征数据。 - **NCI_cpnInfo.csv**:NCI数据集中未表征化合物的相关信息。 - **Prestwick_UTSW_cpnData.csv**:来自Prestwick UTSW数据集的未表征化合物特征数据。 - **Prestwick_UTSW_cpnInfo.csv**:Prestwick UTSW数据集中未表征化合物的相关信息。
创建时间:
2025-07-12
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作