five

TXL-PBC Dataset

收藏
github2024-07-19 更新2024-08-02 收录
下载链接:
https://github.com/lugan113/TXL-PBC_Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
TXL-PBC数据集是一个综合性的细胞图像集合,由多个细胞数据集重新标注和整合而成。该数据集的主要目的是通过样本减少、重新标注和整合来自BCCD和BCD数据集的图像,并与两个新的细胞数据集(PBC数据集和Raabin-WBC数据集)合并,创建一个高质量、样本平衡的新数据集。该数据集专门用于评估各种对象检测模型,特别是使用YOLO格式的模型。

The TXL-PBC dataset is a comprehensive cellular image collection re-annotated and integrated from multiple existing cell datasets. The primary goal of this dataset is to create a high-quality, sample-balanced new dataset by performing sample reduction, re-annotation and integration of images from the BCCD and BCD datasets, and merging them with two novel cellular datasets: the PBC dataset and the Raabin-WBC dataset. This dataset is specifically tailored for evaluating various object detection models, particularly those using the YOLO format.
创建时间:
2024-07-15
原始信息汇总

TXL-PBC 数据集

概述

TXL-PBC 数据集是一个综合性的细胞图像集合,通过对多个细胞数据集进行重新标注和整合而成。该数据集的主要目标是进行样本缩减、重新标注和整合,来源包括 BCCDBCD 数据集。随后,原始数据集与两个新的细胞数据集,即 PBC 数据集 Peripheral Blood Cells 和 Raabin-WBC 数据集 Raabin White Blood Cells 进行整合,创建了一个高质量、样本平衡的新数据集,称为 TXL-PBC 数据集。该数据集使用 Labelimg 工具进行半自动化标注,并采用 YOLOv8n 进行标注。该数据集专门用于评估各种目标检测模型,特别是使用 YOLO 格式的模型。

内容

TXL-PBC 数据集分为训练集(train: 1008)、验证集(val: 288)和测试集(test: 144)。数据集包含三种标签:

  • RBC(红细胞)
  • WBC(白细胞)
  • Platelets(血小板)

数据集结构

数据集的组织结构如下:

TXL-PBC-Dataset/ ├── images/ │ ├── train/ │ │ ├── img1.jpg │ │ ├── img2.jpg │ │ └── ... │ ├── test/ │ │ ├── img1.jpg │ │ ├── img2.jpg │ │ └── ... │ └── val/ │ ├── img1.jpg │ ├── img2.jpg │ └── ... ├── labels/ │ ├── train/ │ │ ├── img1.txt │ │ ├── img2.txt │ │ └── ... │ ├── test/ │ │ ├── img1.txt │ │ ├── img2.txt │ │ └── ... │ └── val/ │ ├── img1.txt │ ├── img2.txt │ └── ... │ ├── classes.txt ├── data.yaml └── README.md

  • images/:包含 train、test 和 val 子文件夹,分别存放相应的图像。
  • labels/:包含 train、test、val 和 classes 子文件夹,分别存放相应的 YOLO 格式标注文件。
  • data.yaml:包含数据集配置,用于 YOLO。

许可证

该数据集采用 MIT 许可证

引用

如果您使用该数据集,请引用:Lu Gan, Xi Li TXL-PBC: a freely accessible labeled peripheral blood cell dataset arXiv:2407.13214.

搜集汇总
数据集介绍
main_image_url
构建方式
TXL-PBC数据集的构建过程涉及多个步骤,首先从BCCD和BCD数据集中进行样本减少、重新标注和整合。随后,该原始数据集与PBC和Raabin-WBC两个新的细胞数据集相结合,形成了一个高质量、样本平衡的新数据集。利用Labelimg工具和YOLOv8n模型进行半自动化标注,确保了标注的准确性和一致性。
特点
TXL-PBC数据集的主要特点在于其综合性和高质量。该数据集不仅包含了来自多个源数据集的细胞图像,还通过半自动化标注技术确保了标注的精确度。此外,数据集的结构设计合理,分为训练集、验证集和测试集,便于模型训练和评估。
使用方法
使用TXL-PBC数据集时,用户可以访问images和labels文件夹,分别包含图像和相应的YOLO格式标注文件。data.yaml文件提供了数据集的配置信息,便于与YOLO模型无缝对接。用户可以根据需要选择训练集、验证集或测试集进行模型训练和评估,确保模型的泛化能力和准确性。
背景与挑战
背景概述
TXL-PBC数据集是一个综合性的细胞图像集合,由多个细胞数据集重新标注和整合而成。该数据集的主要研究目标是进行样本减少、重新标注和整合,源自BCCD和BCD数据集,并进一步整合了PBC数据集和Raabin-WBC数据集,形成了一个高质量、样本均衡的新数据集。该数据集由Lu Gan和Xi Li等研究人员创建,旨在评估各种对象检测模型,特别是使用YOLO格式的模型。通过使用Labelimg工具和YOLOv8n进行半自动化标注,TXL-PBC数据集为细胞图像分析领域提供了重要的资源,推动了相关研究的进展。
当前挑战
TXL-PBC数据集在构建过程中面临多项挑战。首先,样本的重新标注和整合需要高精度的标注工具和方法,以确保数据集的质量和一致性。其次,不同来源的数据集在图像质量和标注标准上可能存在差异,这增加了整合的复杂性。此外,数据集的样本均衡性也是一个重要挑战,确保各类细胞图像的数量和分布合理,以支持全面的模型评估。最后,数据集的公开和使用需要遵循严格的许可协议,确保数据的安全性和合法性。
常用场景
经典使用场景
在生物医学领域,TXL-PBC数据集的经典使用场景主要集中在细胞图像的自动检测与分类。该数据集通过整合多个来源的细胞图像,并进行重新标注和平衡,为研究者提供了一个高质量的基准数据集。特别地,TXL-PBC数据集适用于评估和训练基于YOLO格式的目标检测模型,如YOLOv8n,这些模型在红细胞(RBC)、白细胞(WBC)和血小板(Platelets)的自动识别中表现出色。
实际应用
在实际应用中,TXL-PBC数据集被广泛用于临床诊断和医学研究。例如,在血液分析中,该数据集可以用于开发自动化的血液细胞计数系统,提高诊断效率和准确性。此外,TXL-PBC数据集还可应用于病理学研究,帮助识别和分类不同类型的血液细胞,从而辅助医生进行疾病诊断和治疗方案制定。其高质量的标注和多样化的样本使得该数据集在实际应用中具有广泛的前景。
衍生相关工作
基于TXL-PBC数据集,研究者们开展了一系列相关工作。例如,有研究利用该数据集训练深度学习模型,以提高血液细胞的自动检测精度。此外,还有研究探讨了如何利用TXL-PBC数据集进行跨数据集的模型迁移学习,以解决数据稀缺问题。这些衍生工作不仅丰富了生物医学图像处理的研究内容,也为实际应用提供了新的技术手段。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作