Revvity-25
收藏Hugging Face2025-08-10 更新2025-08-11 收录
下载链接:
https://huggingface.co/datasets/YaroslavPrytula/Revvity-25
下载链接
链接失效反馈官方服务:
资源简介:
Revvity-25全细胞分割数据集,是一个为推动细胞分割研究而设计的新型2025基准。该数据集包含110张高分辨率(1080 x 1080)的亮场图像,每张图像平均包含27个经过人工标记和专家验证的癌细胞,总计标注了2937个细胞。每个细胞的标注平均使用60个多边形点,对于更复杂的结构,标注点数可达400个。该数据集为模态和去模态的语义和实例分割模型提供了精确和详细的细胞边界和重叠部分的注释,是一个独特的新资源。
The Revvity-25 Whole-Cell Segmentation Dataset is a novel 2025 benchmark designed to advance research in cell segmentation. This dataset comprises 110 high-resolution (1080 × 1080) bright-field images, with an average of 27 manually annotated and expert-validated cancer cells per image, totaling 2937 annotated cells. Each cell annotation uses an average of 60 polygon points, with up to 400 points for more complex cellular structures. This dataset provides precise and detailed annotations of cellular boundaries and overlapping regions for both modality-aware and modality-agnostic semantic and instance segmentation models, serving as a unique new research resource.
创建时间:
2025-08-06
原始信息汇总
Revvity-25 数据集概述
基本信息
- 数据集名称: Revvity-25
- 许可证: CC BY-NC 4.0
- 模态: 图像
- 任务类别: 图像分割、目标检测
- 任务ID: 实例分割
- 标注创建方式: 专家生成
- 规模类别: n<1K
- 语言: 英文
- 标签: 图像、JSON、计算机视觉、transformers、实例分割、目标检测、COCO、UNet、显微镜、细胞、生物医学、细胞分割、生物医学成像、显微镜图像、明场、癌细胞、语义分割、数据集、fiftyone
数据集内容
-
图像数量: 110张
-
图像分辨率: 1080 x 1080
-
标注细胞数量: 2937个
-
平均每张图像细胞数量: 27个
-
标注细节: 每个细胞平均使用60个多边形点标注,复杂结构可达400个点
-
目录结构:
Revvity-25/ ├── images/ └── annotations/ ├── train.json └── valid.json
相关资源
- 论文: IAUNet: Instance-Aware U-Net
- GitHub: https://github.com/SlavkoPrytula/IAUNet
- 项目页面: https://slavkoprytula.github.io/IAUNet/
- 数据集下载: Revvity-25
引用信息
bibtex @InProceedings{Prytula_2025_CVPR, author = {Prytula, Yaroslav and Tsiporenko, Illia and Zeynalli, Ali and Fishman, Dmytro}, title = {IAUNet: Instance-Aware U-Net}, booktitle = {Proceedings of the Computer Vision and Pattern Recognition Conference (CVPR) Workshops}, month = {June}, year = {2025}, pages = {4739--4748} }
许可证
- 类型: Creative Commons Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
- 详情: https://creativecommons.org/licenses/by-nc/4.0/
联系方式
搜集汇总
数据集介绍

构建方式
Revvity-25数据集的构建过程体现了生物医学图像分析领域对高质量标注数据的迫切需求。研究团队通过采集110张1080×1080分辨率的高清明场显微镜图像,由专业标注人员对图像中的癌细胞进行精细标注,平均每张图像包含27个经过专家验证的细胞实例。标注过程中采用多边形标注法,每个细胞平均使用60个边界点进行勾勒,复杂细胞结构甚至达到400个标注点,确保了细胞边界和重叠区域的精确表达。数据集按照标准计算机视觉任务需求划分为训练集和验证集,并以COCO格式存储标注信息,为后续研究提供了规范化的数据基础。
使用方法
该数据集主要面向计算机视觉与生物医学交叉领域的研究者,特别适合用于评估实例分割和语义分割模型的性能。用户可通过提供的JSON格式标注文件快速接入主流深度学习框架,配套的网页平台提供可视化浏览功能。研究建议将数据加载至PyTorch或TensorFlow环境,结合UNet等网络架构进行模型训练。由于采用标准COCO标注格式,可直接兼容MMDetection、Detectron2等主流检测框架。需要注意遵循CC-BY-NC-4.0许可协议,确保在符合规定的非商业场景下使用。
背景与挑战
背景概述
Revvity-25数据集由塔尔图大学计算机科学研究所的Yaroslav Prytula等研究人员于2025年推出,旨在推动细胞分割领域的研究进展。该数据集包含110张高分辨率(1080×1080)的明场显微图像,共计标注了2937个癌细胞实例,每个细胞平均由60个多边形点精确勾勒,复杂结构甚至达到400个点。作为首个专注于细胞边界和重叠区域精细标注的数据集,Revvity-25为模态与非模态的语义分割及实例分割任务提供了全新基准,相关成果发表于CVPRW 2025会议,并获Revvity公司和TEM-TA101人工智能专项资助。其高精度标注特性显著提升了生物医学图像分析的可信度,对癌症细胞形态学研究具有重要价值。
当前挑战
在细胞分割领域,Revvity-25致力于解决细胞重叠区域分割模糊、形态变异大等核心难题。数据构建过程中面临多重挑战:明场显微图像的对比度局限导致细胞边界辨识困难,需依赖专家级人工标注确保精度;细胞间紧密堆积与三维投影效应使得实例分离复杂度呈指数增长,需采用平均60个多边形点的超精细标注策略;此外,数据规模受限(不足千例样本)对深度学习模型的泛化能力提出严峻考验。这些挑战既反映了生物医学图像分析的共性瓶颈,也凸显了该数据集在推动小样本学习与复杂形态建模方面的独特价值。
常用场景
经典使用场景
在生物医学图像分析领域,Revvity-25数据集为细胞实例分割任务提供了高质量的标注数据。该数据集包含110张高分辨率的明场显微镜图像,每张图像平均标注了27个癌细胞实例,总计2937个精确标注的细胞。这些标注不仅涵盖了细胞边界,还详细标注了细胞间的重叠区域,为研究细胞分割算法在复杂场景下的性能提供了理想测试平台。数据集特别适用于评估基于深度学习的实例分割模型,如U-Net及其变体,在生物医学图像中的表现。
解决学术问题
Revvity-25数据集有效解决了生物医学图像分析中的若干关键问题。首先,它填补了现有细胞分割数据集中缺乏精确边界标注的空白,每个细胞平均使用60个多边形点进行标注,复杂结构甚至达到400个点。其次,数据集专门针对癌细胞分割任务设计,为癌症研究提供了重要数据支持。最重要的是,数据集支持模态和非模态分割任务,为研究细胞重叠区域的精确分割提供了可能,这对于理解细胞间相互作用具有重要意义。
实际应用
在实际应用中,Revvity-25数据集的价值主要体现在癌症研究和临床诊断支持方面。高质量的细胞分割结果可以辅助病理学家更准确地识别和量化肿瘤组织中的癌细胞分布。在药物研发领域,该数据集可用于评估抗癌药物对细胞形态的影响。此外,数据集还可用于开发自动化的细胞分析系统,提高显微镜图像分析的效率和准确性,为精准医疗提供技术支持。
数据集最近研究
最新研究方向
Revvity-25数据集作为生物医学影像领域的最新基准,聚焦于细胞实例分割技术的前沿探索。该数据集凭借其高分辨率的明场显微图像和精细的多边形标注,为细胞边界识别与重叠区域分析提供了前所未有的研究平台。在计算机视觉与生物医学交叉领域,其精确至400个多边形点的标注质量正推动着模态与非模态分割算法的革新,特别是针对U-Net架构的实例感知改进。近期相关研究已延伸至癌症细胞动态行为分析、药物筛选自动化等热点方向,为精准医疗中的病理诊断和疗效评估提供了关键数据支撑。
以上内容由遇见数据集搜集并总结生成



