计算病理学图块特征
收藏魔搭社区2025-11-27 更新2025-10-04 收录
下载链接:
https://modelscope.cn/datasets/HENGFANG/CPathPatchFeature
下载链接
链接失效反馈官方服务:
资源简介:
<h1 align="center"> Revisiting Data Challenges of Computational Pathology: A Pack-based Multiple Instance Learning Framework </h1>
<p align="center">
<a href="https://arxiv.org/abs/2509.20923"><img src="https://img.shields.io/badge/arXiv-Paper-b31b1b?logo=Arxiv"></a>
<a href=""><img src="https://img.shields.io/badge/HuggingFace-Data-ffd21e?logo=huggingface"></a>
<a href="https://pan.baidu.com/s/1OuiIP3sB68IGZeId4s4K7Q?pwd=ujtq"><img src="https://img.shields.io/badge/百度网盘-数据-06a7ff?logo=baidu"></a>
<!-- <a href=""><img src="https://img.shields.io/badge/知乎-中文讲解-1772f6?logo=zhihu"></a> -->
</p>
<h5 align="center"><em>Wenhao Tang<sup>*</sup>, Heng Fang<sup>*</sup>, Ge Wu, Xiang Li<sup>†</sup>, Ming-Ming Cheng<sup>†</sup> </em></h5>
# 项目概述
**文章地址:[[arXiv]](https://arxiv.org/abs/2509.20923) [[PDF]](https://arxiv.org/pdf/2509.20923)**
**项目主页地址:[[GitHub]](https://github.com/FangHeng/PackMIL)**
> 注意此页面仅为数据发布页,提供给国内研究者下载实验所用数据,可能存在文字或者数据不是最新的问题,如果您在使用这些数据时遇到了任何错误,请及时联系我们进行更新(GitHub的issue或者邮箱可能是更好的选择,这个平台的留言可能看的不多)。
# 数据概述
这里提供了所有我们使用到的WSI数据特征,具体来说有:
- PANDA
- UNI
- CHIEF
- GIGAP
- R50
- patches # 对应特征的坐标
- BRCA
- UNI
- CHIEF
- GIGAP
- R50
- patches # 对应特征的坐标
- NSCLC
- UNI
- CHIEF
- GIGAP
- R50
- patches # 对应特征的坐标
- BLCA
- UNI
- CHIEF
- GIGAP
- R50
- CAMELYON
- CHIEF
- R50
- patches # 对应特征的坐标
> 上面每一个子文件夹都包含了对应数据集所有slide的特征,除了NSCLC和BRCA,其他的数据集都按照每个encoder的特征进行zip打包,下载后需要自行解压。BRCA和NSCLC打包后超过了ModelScope的单文件上限,所以直接按照原始结构上传了,无需进一步解压。
> 有些数据可能还没来得及整理出来,如果有需要也可以联系我们询问是否可以提供。
# 下载方式
> 这里follow了ModelScope的官方文档提供下载方式,更精细的使用方式可能需要使用者自行搜索解决。有问题也可以及时联系我们。
**SDK**
``` python
#数据集下载
from modelscope.msdatasets import MsDataset
ds = MsDataset.load('HENGFANG/CPathPatchFeature')
#您可按需配置 subset_name、split,参照“快速使用”示例代码
```
**GIT**
确保已经正确安装了lfs:
``` bash
git lfs install
```
在此之后,直接进行克隆:
``` bash
git clone https://www.modelscope.cn/datasets/HENGFANG/CPathPatchFeature.git
```
<h1 align="center">重新审视计算病理学的数据挑战:一种基于打包的多实例学习框架</h1>
<p align="center">
<a href="https://arxiv.org/abs/2509.20923"><img src="https://img.shields.io/badge/arXiv-论文-b31b1b?logo=Arxiv"></a>
<a href=""><img src="https://img.shields.io/badge/HuggingFace-数据集-ffd21e?logo=huggingface"></a>
<a href="https://pan.baidu.com/s/1OuiIP3sB68IGZeId4s4K7Q?pwd=ujtq"><img src="https://img.shields.io/badge/百度网盘-数据集-06a7ff?logo=baidu"></a>
<!-- <a href=""><img src="https://img.shields.io/badge/知乎-中文讲解-1772f6?logo=zhihu"></a> -->
</p>
<h5 align="center"><em>唐文豪<sup>*</sup>、方恒<sup>*</sup>、吴戈、李翔<sup>†</sup>、程明明<sup>†</sup></em></h5>
# 项目概述
**文章链接:[[arXiv]](https://arxiv.org/abs/2509.20923) [[全文PDF]](https://arxiv.org/pdf/2509.20923)**
**项目主页:[[GitHub]](https://github.com/FangHeng/PackMIL)**
> 注:本页面仅为数据集发布页,面向国内研究者提供实验所需数据下载服务。本页面文字及数据或存在非最新版本的情况,若您在使用过程中发现任何错误,请及时联系我们进行修正(通过GitHub Issue或邮箱为更佳渠道,本平台留言可能难以被及时查看)。
# 数据概述
本数据集提供了本研究中使用的全部全切片图像(Whole Slide Image, WSI)特征,具体包含以下数据集:
- PANDA数据集
- UNI特征提取结果
- CHIEF特征提取结果
- GIGAP特征提取结果
- R50特征提取结果
- patches # 对应特征的图像块坐标
- BRCA数据集
- UNI特征提取结果
- CHIEF特征提取结果
- GIGAP特征提取结果
- R50特征提取结果
- patches # 对应特征的图像块坐标
- NSCLC数据集
- UNI特征提取结果
- CHIEF特征提取结果
- GIGAP特征提取结果
- R50特征提取结果
- patches # 对应特征的图像块坐标
- BLCA数据集
- UNI特征提取结果
- CHIEF特征提取结果
- GIGAP特征提取结果
- R50特征提取结果
- CAMELYON数据集
- CHIEF特征提取结果
- R50特征提取结果
- patches # 对应特征的图像块坐标
> 上述每个子文件夹均包含对应数据集的全部全切片图像特征。除NSCLC与BRCA数据集外,其余数据集均按不同编码器(encoder)生成的特征单独打包为ZIP压缩包,下载后需自行解压。由于BRCA与NSCLC数据集解压后大小超出ModelScope的单文件上传上限,因此直接以原始目录结构上传,无需额外解压。
> 部分数据尚未完成整理,若有相关需求可联系我们咨询获取事宜。
# 下载方式
> 本页面下载方式遵循ModelScope官方文档说明,关于数据集的精细化使用方法需由使用者自行查阅相关资料。若遇任何问题,亦可随时联系我们。
**SDK 下载方式**
python
# 数据集下载
from modelscope.msdatasets import MsDataset
ds = MsDataset.load('HENGFANG/CPathPatchFeature')
# 您可根据需求配置 subset_name、split 参数,具体可参照「快速使用」示例代码
**Git 克隆方式**
请确保已正确安装Git LFS:
bash
git lfs install
安装完成后,直接执行克隆命令:
bash
git clone https://www.modelscope.cn/datasets/HENGFANG/CPathPatchFeature.git
提供机构:
maas
创建时间:
2025-09-27
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集提供了用于计算病理学研究的图块特征,涵盖PANDA、BRCA、NSCLC、BLCA和CAMELYON等多个病理数据集的WSI特征,包括UNI、CHIEF、GIGAP、R50等编码器提取的特征及对应坐标。它基于Apache License 2.0许可发布,旨在支持国内研究者的实验数据下载需求。
以上内容由遇见数据集搜集并总结生成



