five

1aurent/RxRx1

收藏
Hugging Face2024-05-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/1aurent/RxRx1
下载链接
链接失效反馈
官方服务:
资源简介:
RxRx1是一个专门设计用于系统研究批次效应校正方法的生物数据集。该数据集包含125,510张高分辨率荧光显微镜图像,这些图像是在4种细胞类型中,对1,138种遗传扰动进行51个实验批次的结果。通过视觉检查可以明显看出显著的批次效应。数据集提出了一个分类任务,旨在评估这些图像上实验批次校正方法的有效性,并检查多种校正方法在此任务上的表现。发布RxRx1的目的是鼓励开发能够推广到未见实验批次的有效校正方法。

RxRx1是一个专门设计用于系统研究批次效应校正方法的生物数据集。该数据集包含125,510张高分辨率荧光显微镜图像,这些图像是在4种细胞类型中,对1,138种遗传扰动进行51个实验批次的结果。通过视觉检查可以明显看出显著的批次效应。数据集提出了一个分类任务,旨在评估这些图像上实验批次校正方法的有效性,并检查多种校正方法在此任务上的表现。发布RxRx1的目的是鼓励开发能够推广到未见实验批次的有效校正方法。
提供机构:
1aurent
原始信息汇总

RxRx1: A Dataset for Evaluating Experimental Batch Correction Methods

数据集描述

基本信息

  • 许可证: cc-by-sa-4.0
  • 数据规模: 100K<n<1M
  • 任务类别: image-classification
  • 标签: biology, drug, cells

配置

  • 默认配置:
    • 训练数据: data/train-*
    • 测试数据: data/test-*

数据集信息

  • 特征:
    • image:
      • 类型: array3_d
      • 数据类型: uint8
      • 形状: [512, 512, 6]
    • site_id: 字符串
    • well_id: 字符串
    • cell_type: 字符串
    • experiment: 字符串
    • plate: 整数 (int32)
    • well: 字符串
    • site: 整数 (int32)
    • well_type:
      • 类型: class_label
      • 名称:
        • 0: treatment
        • 1: positive_control
        • 2: negative_control
    • sirna: 字符串
    • sirna_id: 整数 (int32)
    • embeddings:
      • 序列: float32
      • 长度: 128

数据分割

  • 训练集:
    • 字节数: 213139738276
    • 样本数: 81224
  • 测试集:
    • 字节数: 116210798412
    • 样本数: 44286

数据集大小

  • 总大小: 329350536688

其他信息

  • paperswithcode_id: rxrx1
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作