Transitive prediction of small molecule function through alignment of high-content screening resources
收藏NIAID Data Ecosystem2026-05-02 收录
下载链接:
https://figshare.com/articles/dataset/Transitive_prediction_of_small_molecule_function_through_alignment_of_high-content_screening_resources/27756177
下载链接
链接失效反馈官方服务:
资源简介:
# Datasets used in Transitive prediction of small molecule function through alignment of high-content screening resources
This dataset supports the development of CLIPn, a contrastive-learning framework designed to align heterogeneous high-content screening (HCS) profile datasets.
***GitHub link:*** https://github.com/AltschulerWu-Lab/CLIPn
## Directory Structure
### Data Files
- **HCS_datasets.pkl**: Contains 13 high-content screening (HCS) datasets from multiple studies across 20 years.
- **Hypoxia.pkl**: Contains 8 profile datasets using different assays and treated under diverse hypoxia durations.
- **Expression.pkl**: Contains 2 transcriptional profile datasets and 6 image profile datasets for multimodal analysis.
### Folders
#### raw_profiles
##### HCS13/
- Contains raw data from 13 high-content screening (HCS) datasets. Each dataset includes meta and feature files.
##### L1000/
- **CDRP_feature_exp.csv**: Raw L1000 expression data from the CDRP dataset.
- **CDRP_meta_exp.csv**: Metadata associated with the CDRP expression data.
- **LINCS_feature_exp.csv**: Raw L1000 expression data from the LINCS dataset.
- **LINCS_meta_exp.csv**: Metadata associated with the LINCS expression data.
##### RxRx3/
- **RxRx3_feature_final.csv**: Profile data from the RxRx3 dataset.
- **RxRx3_meta_final.csv**: Metadata from the RxRx3 dataset.
##### Uncharacterized_compounds/
- **NCI_cpnData.csv**: Feature data for uncharacterized compounds from the NCI dataset.
- **NCI_cpnInfo.csv**: Information about uncharacterized compounds in the NCI dataset.
- **Prestwick_UTSW_cpnData.csv**: Feature data for uncharacterized compounds from the Prestwick UTSW dataset.
- **Prestwick_UTSW_cpnInfo.csv**: Information about uncharacterized compounds from the Prestwick UTSW dataset.
# 基于高内涵筛选(high-content screening, HCS)资源对齐的小分子功能传递预测研究所用数据集
本数据集用于支撑CLIPn的开发,CLIPn是一种专为对齐异构高内涵筛选(HCS)数据集而设计的对比学习框架。
***GitHub 链接:*** https://github.com/AltschulerWu-Lab/CLIPn
## 目录结构
### 数据文件
- **HCS_datasets.pkl**:包含20年来多项研究的13个高内涵筛选(HCS)数据集。
- **Hypoxia.pkl**:包含8个采用不同实验方法、在不同缺氧时长下处理得到的画像数据集。
- **Expression.pkl**:包含2个转录组画像数据集与6个图像画像数据集,用于多模态分析。
### 文件夹
#### 原始画像数据集
##### HCS13/
- 包含13个高内涵筛选(HCS)数据集的原始数据,每个数据集均包含元数据文件与特征文件。
##### L1000/
- **CDRP_feature_exp.csv**:来自CDRP数据集的原始L1000表达数据。
- **CDRP_meta_exp.csv**:与CDRP表达数据相关的元数据。
- **LINCS_feature_exp.csv**:来自LINCS数据集的原始L1000表达数据。
- **LINCS_meta_exp.csv**:与LINCS表达数据相关的元数据。
##### RxRx3/
- **RxRx3_feature_final.csv**:来自RxRx3数据集的画像数据。
- **RxRx3_meta_final.csv**:来自RxRx3数据集的元数据。
##### Uncharacterized_compounds/
- **NCI_cpnData.csv**:来自NCI数据集的未表征化合物特征数据。
- **NCI_cpnInfo.csv**:NCI数据集中未表征化合物的相关信息。
- **Prestwick_UTSW_cpnData.csv**:来自Prestwick UTSW数据集的未表征化合物特征数据。
- **Prestwick_UTSW_cpnInfo.csv**:Prestwick UTSW数据集中未表征化合物的相关信息。
创建时间:
2025-07-12



