VoDaSuRe
收藏数据集概况
VoDaSuRe 是一个大规模的体素超分辨率(VSR)数据集,旨在研究实验室CT(Lab-CT)采集之间的域偏移问题。该数据集与CVPR 2026论文一同发布。
核心信息
- 总扫描数量:32个体积扫描,覆盖16个样本。
- 采集方式:在不同成像条件下对每个样本进行配对的高、低分辨率体素采集。
- 数据用途:适用于体素超分辨率(3D SR)、域泛化与域偏移分析、基于学习的SR方法基准测试。
数据集结构
数据集按训练集和测试集划分,层级结构如下:
VoDaSuRe/ └── ome/ ├── train/ └── test/
所有体积数据以OME-Zarr格式存储。
数据格式(OME-Zarr)
每个样本的 .zarr 层级包含三种模态,每种模态包含不同分辨率层级:
- HR:高分辨率参考体积(包含0至3级分辨率)
- LR:未配准的低分辨率体积(包含0至3级分辨率)
- REG:已配准且强度匹配的低分辨率体积(包含0至1级分辨率)
数据集大小
- 总大小:约489 GB(压缩后)
- 解压后磁盘需求:约500 GB
下载方式
-
Python(推荐): python from huggingface_hub import snapshot_download
snapshot_download( repo_id="AugustHoeg/VoDaSuRe", repo_type="dataset" )
-
Git LFS: bash git lfs install git clone https://huggingface.co/datasets/AugustHoeg/VoDaSuRe
数据使用
数据以压缩的 .tar 归档文件提供,解压后可使用支持OME-Zarr的库(如 zarr、ome-zarr-py、dask)访问。数据维度顺序为 (D, H, W),其中第一维 D 对应切片索引。
示例(加载并查看切片): python import zarr
z = zarr.open("ome/train/Bamboo_A_bin1x1_ome_1.zarr", mode="r") img_hr = z["HR/0"][1000, :, :] # 高分辨率切片 img_reg = z["REG/0"][250, :, :] # 配准后的低分辨率切片 img_lr = z["LR/0"][1000, :, :] # 未配准的低分辨率切片
注意:加载完整体积可能超出系统内存。
数据集创建
通过实验室CT(Lab-CT)进行配对的高、低分辨率体积采集而创建。
许可
- 许可证:CC-BY-4.0
引用
bibtex @article{hoeg2026vodasure, title={VoDaSuRe: A Large-Scale Dataset Revealing Domain Shift in Volumetric Super-Resolution}, author={August Leander Høeg and Sophia Wiinberg Bardenfleth and Hans Martin Kjer and Tim Bjørn Dyrby and Vedrana Andersen Dahl and Anders Dahl}, journal={Proceedings of the Computer Vision and Pattern Recognition Conference}, year={2026}, url={https://augusthoeg.github.io/VoDaSuRe/} }




