iagovarela/poultry-disease-dataset
收藏Hugging Face2026-03-18 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/iagovarela/poultry-disease-dataset
下载链接
链接失效反馈官方服务:
资源简介:
# Chicken Feces Dataset - Baseline Clean
## Descripción
Dataset curado de imágenes de heces de gallina para clasificación multiclase de enfermedades aviares.
El objetivo de este dataset es servir como base para el entrenamiento y evaluación de modelos de visión por computador capaces de clasificar imágenes de heces en distintas categorías patológicas y no patológicas.
## Clases
Las clases finales del dataset son:
- `healthy`
- `coccidiosis`
- `newcastle`
- `salmonella`
## Contenido del repositorio
- `images/`
Contiene las imágenes finales del dataset.
- `labels.csv`
Contiene la etiqueta final asociada a cada imagen.
- `sources.csv`
Contiene la trazabilidad de cada imagen respecto a su fuente original.
## Tamaño del dataset
- **Número total de imágenes:** 9611
## Distribución por clase
- **coccidiosis:** 2958
- **healthy:** 2985
- **newcastle:** 659
- **salmonella:** 3009
## Origen de los datos
Las imágenes proceden de varias fuentes públicas disponibles en internet, descargadas localmente y conservadas en bruto durante el proceso de construcción del dataset.
Las fuentes utilizadas fueron:
- `src01_main`
- `src02_poultry`
- `src03_extra`
## Proceso de curación realizado
Para construir esta versión final del dataset se llevaron a cabo las siguientes fases:
- separación de las fuentes originales
- unificación de etiquetas en 4 clases finales
- creación de un inventario maestro
- verificación de existencia de archivos
- comprobación de etiquetas finales
- detección y eliminación de duplicados exactos
- reducción de solapamiento fuerte entre fuentes
- asignación de identificadores únicos
- renombrado final de archivos
- exportación de `labels.csv` y `sources.csv`
## Notas
- La carpeta `01_raw` conserva los datos originales sin modificar dentro del entorno local de trabajo.
- Esta versión final del dataset **no incluye todavía particiones** de entrenamiento, validación y prueba.
- El dataset puede utilizarse como una **baseline limpia, trazable y reutilizable** para tareas de clasificación multiclase.
## Archivos principales
### `labels.csv`
Incluye las siguientes columnas:
- `image_id`
- `filename`
- `label`
### `sources.csv`
Incluye las siguientes columnas:
- `image_id`
- `filename`
- `source_id`
- `original_filename`
- `original_label`
- `raw_path`
## Uso previsto
Este dataset está pensado para:
- experimentación académica
- entrenamiento de modelos de clasificación de imágenes
- evaluación de pipelines de curación y trazabilidad de datos
- desarrollo de prototipos dentro de sistemas de monitorización avícola inteligente
## Limitaciones
- No incluye particiones `train/val/test`.
- Puede requerir revisión manual adicional en futuras versiones.
- La distribución por clases no es completamente equilibrada, especialmente en la clase `newcastle`.
- El dataset se presenta como una baseline curada, no como una versión clínica o productiva final.
## Estado actual
Esta publicación corresponde a una **versión baseline limpia** del dataset final.
提供机构:
iagovarela



