five

minwoosun/CholecSeg8k

收藏
Hugging Face2024-01-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/minwoosun/CholecSeg8k
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: cc-by-nc-sa-4.0 task_categories: - image-segmentation language: - en tags: - medical - biology pretty_name: CholecSeg8k size_categories: - 1K<n<10K --- # Description: [paper](https://arxiv.org/abs/2012.12453) | [kaggle](https://www.kaggle.com/datasets/newslab/cholecseg8k) The CholecSeg8k dataset, an extension of the Cholec80 collection, includes 8,080 carefully annotated images from laparoscopic cholecystectomy surgeries, selected from 17 video clips in Cholec80. Each image in CholecSeg8K is pixel-level annotated for thirteen different surgical elements. The dataset is efficiently organized in a directory structure, featuring 101 folders, each containing 80 frames at a resolution of 854x480, along with three types of masks for each frame: a color mask for visualization, an annotation tool mask, and a watershed mask for simplified processing. This comprehensive dataset, freely available under the CC BY-NC-SA 4.0 license, is a critical resource for advancing the field of computer-assisted surgical procedures. # Loading the data: First install the `datasets` library, then run the following code, ```python from datasets import load_dataset dataset = load_dataset("minwoosun/CholecSeg8k", trust_remote_code=True) ``` # Simple demo: This short demo shows how to load the data and directly visualize an image along with the corresponding masks. ```python from datasets import load_dataset import matplotlib.pyplot as plt dataset = load_dataset("minwoosun/CholecSeg8k", trust_remote_code=True) def display_image(dataset, image_index): '''Display the image and corresponding three masks.''' fig, axs = plt.subplots(2, 2, figsize=(10, 10)) for ax in axs.flat: ax.axis('off') # Display each image in its respective subplot axs[0, 0].imshow(dataset['train'][image_index]['image']) axs[0, 1].imshow(dataset['train'][image_index]['color_mask']) axs[1, 0].imshow(dataset['train'][image_index]['watershed_mask']) axs[1, 1].imshow(dataset['train'][image_index]['annotation_mask']) # Adjust spacing between images plt.subplots_adjust(wspace=0.01, hspace=-0.6) plt.show() display_image(dataset, 800) # video index from 0 to 8079 ``` ![example image](example.png) # Citation (BibTex): ``` @misc{hong2020cholecseg8k, title={CholecSeg8k: A Semantic Segmentation Dataset for Laparoscopic Cholecystectomy Based on Cholec80}, author={W. -Y. Hong and C. -L. Kao and Y. -H. Kuo and J. -R. Wang and W. -L. Chang and C. -S. Shih}, year={2020}, eprint={2012.12453}, archivePrefix={arXiv}, primaryClass={cs.CV} } ``` # Data card contact: Min Woo Sun (minwoos@stanford.edu)

许可证:CC BY-NC-SA 4.0(知识共享署名-非商业性使用-相同方式共享4.0) 任务类别: - 图像分割(image-segmentation) 语言: - 英语(en) 标签: - 医疗 - 生物学 友好名称:CholecSeg8k 样本规模类别: - 1K<n<10K(千级至万级样本) --- # 数据集描述: [论文](https://arxiv.org/abs/2012.12453) | [Kaggle数据集页面](https://www.kaggle.com/datasets/newslab/cholecseg8k) CholecSeg8k数据集是Cholec80数据集合集的扩展版本,包含从Cholec80的17段视频片段中遴选的8080张经过精细标注的腹腔镜胆囊切除术手术图像。CholecSeg8k中的每张图像均针对13种不同手术结构进行了像素级标注。该数据集采用高效的目录结构进行组织,共包含101个文件夹,每个文件夹内存有80张分辨率为854×480的帧图像,且每张帧配有三类掩码:用于可视化的彩色掩码、标注工具掩码,以及用于简化处理的分水岭掩码(watershed mask)。本数据集遵循CC BY-NC-SA 4.0协议免费开放,是推动计算机辅助外科手术领域发展的关键资源。 # 数据加载方法: 首先安装`datasets`库,随后运行如下代码: python from datasets import load_dataset dataset = load_dataset("minwoosun/CholecSeg8k", trust_remote_code=True) # 简易演示: 本简短演示展示如何加载数据集并直接可视化图像及其对应掩码。 python from datasets import load_dataset import matplotlib.pyplot as plt dataset = load_dataset("minwoosun/CholecSeg8k", trust_remote_code=True) def display_image(dataset, image_index): '''可视化图像及其对应的三类掩码。''' fig, axs = plt.subplots(2, 2, figsize=(10, 10)) for ax in axs.flat: ax.axis('off') # 在对应子图中展示每张图像 axs[0, 0].imshow(dataset['train'][image_index]['image']) axs[0, 1].imshow(dataset['train'][image_index]['color_mask']) axs[1, 0].imshow(dataset['train'][image_index]['watershed_mask']) axs[1, 1].imshow(dataset['train'][image_index]['annotation_mask']) # 调整图像间距 plt.subplots_adjust(wspace=0.01, hspace=-0.6) plt.show() display_image(dataset, 800) # 视频索引范围为0至8079 ![示例图像](example.png) # 引用(BibTex格式): @misc{hong2020cholecseg8k, title={CholecSeg8k: A Semantic Segmentation Dataset for Laparoscopic Cholecystectomy Based on Cholec80}, author={W. -Y. Hong and C. -L. Kao and Y. -H. Kuo and J. -R. Wang and W. -L. Chang and C. -S. Shih}, year={2020}, eprint={2012.12453}, archivePrefix={arXiv}, primaryClass={cs.CV} } # 数据集卡片联系人: Min Woo Sun(电子邮箱:minwoos@stanford.edu)
提供机构:
minwoosun
原始信息汇总

数据集概述

基本信息

  • 许可证: CC BY-NC-SA 4.0
  • 任务类别: 图像分割
  • 语言: 英语
  • 标签: 医学, 生物学
  • 数据集名称: CholecSeg8k
  • 数据规模: 1K<n<10K

描述

CholecSeg8k 数据集是 Cholec80 集合的扩展,包含从 Cholec80 中的 17 个视频片段中精心挑选的 8,080 张图像,这些图像来自腹腔镜胆囊切除手术。每个图像都针对十三种不同的手术元素进行了像素级标注。数据集以目录结构高效组织,包含 101 个文件夹,每个文件夹包含 80 帧,分辨率为 854x480,每帧包含三种类型的掩码:用于可视化的颜色掩码、用于标注工具的掩码和用于简化处理的 watershed 掩码。该数据集在 CC BY-NC-SA 4.0 许可证下免费提供,是推动计算机辅助手术领域的重要资源。

数据加载

首先安装 datasets 库,然后运行以下代码: python from datasets import load_dataset

dataset = load_dataset("minwoosun/CholecSeg8k", trust_remote_code=True)

简单示例

以下示例展示了如何加载数据并直接可视化图像及其相应的掩码: python from datasets import load_dataset import matplotlib.pyplot as plt

dataset = load_dataset("minwoosun/CholecSeg8k", trust_remote_code=True)

def display_image(dataset, image_index): Display the image and corresponding three masks.

fig, axs = plt.subplots(2, 2, figsize=(10, 10))

for ax in axs.flat:
    ax.axis(off)

# Display each image in its respective subplot
axs[0, 0].imshow(dataset[train][image_index][image])
axs[0, 1].imshow(dataset[train][image_index][color_mask])
axs[1, 0].imshow(dataset[train][image_index][watershed_mask])
axs[1, 1].imshow(dataset[train][image_index][annotation_mask])

# Adjust spacing between images
plt.subplots_adjust(wspace=0.01, hspace=-0.6)

plt.show()

display_image(dataset, 800) # video index from 0 to 8079

引用

@misc{hong2020cholecseg8k, title={CholecSeg8k: A Semantic Segmentation Dataset for Laparoscopic Cholecystectomy Based on Cholec80}, author={W. -Y. Hong and C. -L. Kao and Y. -H. Kuo and J. -R. Wang and W. -L. Chang and C. -S. Shih}, year={2020}, eprint={2012.12453}, archivePrefix={arXiv}, primaryClass={cs.CV} }

数据卡联系

Min Woo Sun (minwoos@stanford.edu)

搜集汇总
数据集介绍
main_image_url
构建方式
CholecSeg8k数据集是由Cholec80集合的扩展,精心挑选了8,080张腹腔镜胆囊切除术视频中的图像,并对这些图像进行了像素级别的标注。这些图像来源于17个视频片段,每个片段中的图像被组织在101个文件夹中,每个文件夹包含80帧图像,分辨率高达854x480。每帧图像都配备了三种类型的掩码,包括用于可视化的彩色掩码、注释工具掩码以及用于简化处理的流域掩码,从而为计算机辅助手术流程的研究提供了全面而高效的数据结构。
使用方法
使用CholecSeg8k数据集首先需要安装datasets库,通过简单的代码即可加载整个数据集。加载后,数据集的图像和掩码可以通过索引方便地访问和显示。此外,还提供了示例代码,演示如何加载数据并可视化图像及其对应的掩码,使得研究者能够快速上手并开展相关研究。
背景与挑战
背景概述
CholecSeg8k数据集,作为Cholec80集合的扩展,包含了来自17段腹腔镜胆囊切除术视频中的8080张精心标注的图像。该数据集的创建,旨在推进计算机辅助手术领域的发展,由W. -Y. Hong、C. -L. Kao等研究人员于2020年提出,并公开发布于CC BY-NC-SA 4.0许可之下。数据集中的每张图像都进行了像素级别的标注,用以区分十三种不同的手术元素,为医学图像分割领域提供了宝贵的研究资源,对提升手术自动化水平具有重要意义。
当前挑战
在研究领域,CholecSeg8k数据集面临的挑战主要包括:一是精确区分多种手术元素的图像分割问题,这对算法的精细度提出了高要求;二是数据集构建过程中的标注一致性及准确性保证,这涉及到了医学知识和图像处理技术的深度融合。此外,如何高效地利用这些数据以促进计算机辅助手术技术的发展,也是当前研究的一大挑战。
常用场景
经典使用场景
在医学图像分析的领域内,minwoosun/CholecSeg8k数据集的典型应用场景是对腹腔镜胆囊切除术中的图像进行像素级别的语义分割。该数据集包含8,080张精细注释的图像,为研究人员提供了一个丰富的资源,以训练和评估计算机辅助手术过程中的图像识别算法。
解决学术问题
该数据集解决了医学图像处理中的一个关键问题,即如何在复杂的手术场景中准确识别和分割不同的手术元素。通过这一数据集,研究者能够开发出更加精确的图像分割模型,这对于提高手术自动化水平、减少医生工作强度以及提升手术安全性具有重要的学术价值和临床意义。
实际应用
minwoosun/CholecSeg8k数据集的实际应用广泛,包括但不限于辅助医生进行手术规划、实时手术导航以及术后评估。这些应用能够提高手术的准确性和效率,对于促进精准医疗和智慧医疗的发展具有深远的影响。
数据集最近研究
最新研究方向
在医学图像处理领域,尤其是腔镜胆囊切除术的语义分割研究中,minwoosun/CholecSeg8k数据集正日益成为研究的热点。该数据集以8,080张精细注释的图像为研究基础,为计算机辅助手术流程的深入研究提供了关键资源。当前研究方向的焦点在于提升图像分割的精确度和效率,进而优化手术辅助系统的性能,减少手术风险,提高手术成功率。CholecSeg8k数据集以其全面的标注和合理的结构组织,为这一领域的研究人员提供了一个宝贵的研究平台,推动了相关技术的发展和应用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作