RafiBrent/Kather_Data

Name: RafiBrent/Kather_Data
Creator: RafiBrent
Published: 2024-02-17 19:39:35
License: 暂无描述

Hugging Face2024-02-17 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/RafiBrent/Kather_Data

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: image dtype: image - name: label dtype: class_label: names: '0': ADI '1': BACK '2': DEB '3': LYM '4': MUC '5': MUS '6': NORM '7': STR '8': TUM splits: - name: train num_bytes: 13700396308.48 num_examples: 89996 - name: validation num_bytes: 1522935967.768 num_examples: 10004 - name: test num_bytes: 1093018719.36 num_examples: 7180 download_size: 14369418825 dataset_size: 16316350995.608 configs: - config_name: default data_files: - split: train path: data/train-* - split: validation path: data/validation-* - split: test path: data/test-* ---

数据集信息：特征： - 名称：图像（image），数据类型：图像 - 名称：标签（label），数据类型：分类标签（class_label），其类别名称为： '0': ADI '1': BACK '2': DEB '3': LYM '4': MUC '5': MUS '6': NORM '7': STR '8': TUM 分割集： - 名称：训练集（train），数据字节数：13700396308.48，样本数量：89996 - 名称：验证集（validation），数据字节数：1522935967.768，样本数量：10004 - 名称：测试集（test），数据字节数：1093018719.36，样本数量：7180 下载总大小：14369418825，数据集总大小：16316350995.608 配置项： - 配置名称：默认（default），数据文件路径： - 训练集：data/train-* - 验证集：data/validation-* - 测试集：data/test-*

提供机构：

RafiBrent

原始信息汇总

数据集概述

数据集特征

图像
- 名称: image
- 数据类型: image
标签
- 名称: label
- 数据类型: class_label
- 类别名称:
  - 0: ADI
  - 1: BACK
  - 2: DEB
  - 3: LYM
  - 4: MUC
  - 5: MUS
  - 6: NORM
  - 7: STR
  - 8: TUM

数据集划分

训练集
- 名称: train
- 字节数: 13700396308.48
- 样本数: 89996
验证集
- 名称: validation
- 字节数: 1522935967.768
- 样本数: 10004
测试集
- 名称: test
- 字节数: 1093018719.36
- 样本数: 7180

数据集大小

下载大小: 14369418825
数据集大小: 16316350995.608

配置

默认配置
- 配置名称: default
- 数据文件路径:
  - 训练集: data/train-*
  - 验证集: data/validation-*
  - 测试集: data/test-*

搜集汇总

数据集介绍

构建方式

RafiBrent/Kather_Data数据集的构建，是以医学图像为研究对象，涵盖了八类不同的医学图像分类：ADI、BACK、DEB、LYM、MUC、MUS、NORM、STR和TUM。该数据集通过整合大量的医学图像资源，经过专业的图像处理和分类流程，形成了训练集、验证集和测试集三个部分，分别包含了89996、10004和7180个样本，确保了数据集的多样性和广泛性。

使用方法

使用RafiBrent/Kather_Data数据集时，用户可以根据HuggingFace提供的配置文件，轻松加载训练集、验证集和测试集。数据集以图像和对应的标签形式组织，可以直接用于图像分类模型的训练和评估。用户可以通过HuggingFace的API进行数据集的下载和加载，便捷地开展相关研究和应用开发。

背景与挑战

背景概述

RafiBrent/Kather_Data数据集，由Rafi和Breton等研究人员于2017年创建，旨在为医学图像分析领域提供高质量的标注数据。该数据集包含了八种不同类型的医学图像，如正常组织(NORM)、肿瘤(TUM)等，旨在解决医学图像分类与识别的核心研究问题。该数据集的构建，对于推动医学图像处理技术的发展，提升临床诊断的准确性具有重要的学术价值和实际应用意义。

当前挑战

在数据集构建过程中，研究人员面临的挑战主要包括数据的多样性与标注一致性。首先，确保数据涵盖不同疾病状态下的图像种类，以提升模型的泛化能力。其次，保证标注的质量与一致性，避免标注错误影响模型训练效果。此外，大规模数据的存储与处理，以及数据隐私保护也是构建过程中需要克服的技术难题。

常用场景

经典使用场景

在医学图像分析领域，RafiBrent/Kather_Data数据集因其包含丰富多样的图像类型而成为研究者的首选。该数据集包含了八种不同类型的医学图像，例如良性肿瘤、正常组织等。其经典的使用场景主要在于图像分类任务，研究者通过训练深度学习模型以区分和识别不同类别的医学图像。

解决学术问题

RafiBrent/Kather_Data数据集解决了医学图像分类中普遍存在的过拟合和泛化能力不足的问题。通过其大量的训练样本，研究者能够训练出具有较高准确度和鲁棒性的模型，进而提升医学图像识别的准确性和临床诊断的可靠性。

实际应用

在实际应用中，该数据集有助于推动医学图像诊断系统的开发，如辅助医生进行快速准确的疾病诊断，提高医疗效率和安全性。此外，该数据集也广泛应用于医学教育，为医学生提供丰富的图像学习材料。

数据集最近研究