five

iagovarela/poultry-disease-dataset

收藏
Hugging Face2026-03-18 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/iagovarela/poultry-disease-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
# Chicken Feces Dataset - Baseline Clean ## Descripción Dataset curado de imágenes de heces de gallina para clasificación multiclase de enfermedades aviares. El objetivo de este dataset es servir como base para el entrenamiento y evaluación de modelos de visión por computador capaces de clasificar imágenes de heces en distintas categorías patológicas y no patológicas. ## Clases Las clases finales del dataset son: - `healthy` - `coccidiosis` - `newcastle` - `salmonella` ## Contenido del repositorio - `images/` Contiene las imágenes finales del dataset. - `labels.csv` Contiene la etiqueta final asociada a cada imagen. - `sources.csv` Contiene la trazabilidad de cada imagen respecto a su fuente original. ## Tamaño del dataset - **Número total de imágenes:** 9611 ## Distribución por clase - **coccidiosis:** 2958 - **healthy:** 2985 - **newcastle:** 659 - **salmonella:** 3009 ## Origen de los datos Las imágenes proceden de varias fuentes públicas disponibles en internet, descargadas localmente y conservadas en bruto durante el proceso de construcción del dataset. Las fuentes utilizadas fueron: - `src01_main` - `src02_poultry` - `src03_extra` ## Proceso de curación realizado Para construir esta versión final del dataset se llevaron a cabo las siguientes fases: - separación de las fuentes originales - unificación de etiquetas en 4 clases finales - creación de un inventario maestro - verificación de existencia de archivos - comprobación de etiquetas finales - detección y eliminación de duplicados exactos - reducción de solapamiento fuerte entre fuentes - asignación de identificadores únicos - renombrado final de archivos - exportación de `labels.csv` y `sources.csv` ## Notas - La carpeta `01_raw` conserva los datos originales sin modificar dentro del entorno local de trabajo. - Esta versión final del dataset **no incluye todavía particiones** de entrenamiento, validación y prueba. - El dataset puede utilizarse como una **baseline limpia, trazable y reutilizable** para tareas de clasificación multiclase. ## Archivos principales ### `labels.csv` Incluye las siguientes columnas: - `image_id` - `filename` - `label` ### `sources.csv` Incluye las siguientes columnas: - `image_id` - `filename` - `source_id` - `original_filename` - `original_label` - `raw_path` ## Uso previsto Este dataset está pensado para: - experimentación académica - entrenamiento de modelos de clasificación de imágenes - evaluación de pipelines de curación y trazabilidad de datos - desarrollo de prototipos dentro de sistemas de monitorización avícola inteligente ## Limitaciones - No incluye particiones `train/val/test`. - Puede requerir revisión manual adicional en futuras versiones. - La distribución por clases no es completamente equilibrada, especialmente en la clase `newcastle`. - El dataset se presenta como una baseline curada, no como una versión clínica o productiva final. ## Estado actual Esta publicación corresponde a una **versión baseline limpia** del dataset final.
提供机构:
iagovarela
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作