hpestrellag/engagement_minutes
收藏Hugging Face2025-11-24 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/hpestrellag/engagement_minutes
下载链接
链接失效反馈官方服务:
资源简介:
---
language:
- es
- en
license: cc-by-nc-4.0
pretty_name: engagement_minutes
tags:
- synthetic
- streaming
- user-behavior
- churn-prediction
- machine-learning
task_categories:
- tabular-classification
task_ids:
- tabular-multi-class-classification
---
# 📦 **ENGAGEMENT MINUTES**
Este dataset fue **generado completamente de manera sintética**, empleando:
* Modelos estadísticos en Python
* Algoritmos probabilísticos personalizados
* Modelos de inteligencia artificial para añadir variabilidad y comportamientos realistas
No contiene datos personales ni información proveniente de individuos reales.
Su propósito es **estrictamente educativo, académico, experimental y de investigación**.
---
## 📝 **Dataset Summary**
Este dataset contiene datos sintéticos diseñados para simular interacciones ficticias de usuarios. Está optimizado para prácticas de análisis de datos, experimentación en ciencia de datos y prototipos de machine learning.
No debe utilizarse para aplicaciones comerciales ni para la creación de perfiles reales.
---
## 📊 **Estructura del Dataset**
El dataset incluye las siguientes columnas:
| Columna | Tipo | Descripción |
| ----------------------------------- | ---- | ----------- |
|`customer_id` |string| Identificador único del cliente. |
| `minutes_watched_rest_of_last_week` | float | Minutos visualizados durante el resto de la semana actual. |
| `minutes_watched_week_2` | float | Minutos visualizados hace dos semanas. |
| `minutes_watched_week_3` | float | Minutos visualizados hace tres semanas. |
| `minutes_watched_week_4` | float | Minutos visualizados hace cuatro semanas. |
| `minutes_watched_last_3d` | float | Minutos visualizados en los últimos 3 días. |
| `minutes_watched_last_1d` | float | Minutos visualizados en el último día. |
| `minutes_watched_second_last_day` | float | Minutos visualizados en el penúltimo día. |
| `minutes_watched_delta_week_1_2` | float | Diferencia de minutos vistos entre la semana actual y la semana −2. |
| `minutes_watched_delta_week_2_3` | float | Diferencia de minutos vistos entre la semana −2 y la semana −3. |
| `minutes_watched_delta_week_3_4` | float | Diferencia de minutos vistos entre la semana −3 y la semana −4. |
| `minutes_watched_delta_rest_of_week`| float | Diferencia en minutos vistos durante el resto de la semana actual respecto a la anterior. |
| `minutes_watched_delta_last_3d` | float | Diferencia de minutos vistos en los últimos 3 días frente a los 3 días previos. |
| `minutes_watched_delta_last_1d` | float | Diferencia de minutos vistos en el último día respecto al día anterior. |
| `minutes_watched_delta_second_last_day`| float | Diferencia de minutos vistos en el penúltimo día frente al antepenúltimo. |
| `minutes_watched_delta_third_last_day` | float | Diferencia de minutos vistos en el antepenúltimo día respecto al cuarto día anterior.|
**Obs:** Las columnas numéricas si tienen un valor `-` significa el número `0`.
### Descripcion de Rangos para `minutes_watched`:
| Rango de valores | Significado |
| ---------------------------- | --------------------------------------------------------------------------------------------------------------------------------------------- |
| `NaN` | Posiblemente no hubo registros o dispositivo apagados. |
| `-10000` | Dispositivo apagado o fuera de servicio (no intentar interpretarlo como minutos reales). |
| `>0` | Minutos estimados vistos con **servicio normal**. |
| `<0` | Minutos estimados vistos con **servicio deficiente**. El valor absoluto es igual a los minutos vistos; el signo negativo indica mala calidad del servicio. |
---
## 📥 Cómo Cargar el Dataset desde Hugging Face
### 🔹 Opción 1:
1. Usando `datasets.load_dataset`:
```python
from datasets import load_dataset
ds = load_dataset("hpestrellag/engagement_minutes")
ds
````
2. Convertir a Pandas:
```python
import pandas as pd
df = ds["train"].to_pandas()
df.head()
```
### 🔹 Opción 2:
Leer el CSV directamente desde Hugging Face Hub
```python
import pandas as pd
df = pd.read_csv("hf://datasets/hpestrellag/engagement_minutes/engagement_minutes.csv")
df.head()
```
---
## 🔐 **Licencia**
Este dataset se publica bajo la licencia:
# **Creative Commons Atribución-NoComercial 4.0 (CC BY-NC 4.0)**
### Permisos y restricciones:
✔️ **Permitido**:
* Uso académico
* Investigación
* Prototipos no comerciales
* Uso personal o educativo
❌ **No permitido**:
* Uso comercial
* Integración en productos de pago
* Proyectos que generen ingresos directos o indirectos
🔗 Licencia completa:
[https://creativecommons.org/licenses/by-nc/4.0/](https://creativecommons.org/licenses/by-nc/4.0/)
---
## 📚 **Cómo Citar Este Dataset**
```bibtex
@misc{estrella2025_engagement_minutes,
title = {engagement\_minutes},
author = {{Pavel Estrella G.}},
year = {2025},
publisher = {Hugging Face Datasets},
howpublished = {\url{https://huggingface.co/datasets/hpestrellag/engagement_minutes}},
note = {Dataset sintético generado para investigación. Licencia CC BY-NC 4.0.}
}
```
---
## ⚠️ **Notas Sobre Datos Sintéticos**
* No representan individuos reales.
* No fueron obtenidos de personas, empresas o fuentes externas.
* No contienen información sensible.
* Se generaron enteramente mediante métodos estadísticos y modelos de IA.
* No deben utilizarse para tareas que requieran datos reales (marketing, segmentación real, perfiles reales).
---
## 👤 **Autor**
**PAVEL ESTRELLA G.**
提供机构:
hpestrellag



