five

hpestrellag/inapp_activity

收藏
Hugging Face2025-11-23 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/hpestrellag/inapp_activity
下载链接
链接失效反馈
官方服务:
资源简介:
--- language: - es - en license: cc-by-nc-4.0 pretty_name: inapp_activity tags: - synthetic - streaming - user-behavior - churn-prediction - machine-learning task_categories: - tabular-classification task_ids: - tabular-multi-class-classification --- # 📦 **NOMBRE_DEL_DATASET** Este dataset fue **generado completamente de manera sintética**, empleando: * Modelos estadísticos en Python * Algoritmos probabilísticos personalizados * Modelos de inteligencia artificial para añadir variabilidad y comportamientos realistas No contiene datos personales ni información proveniente de individuos reales. Su propósito es **estrictamente educativo, académico, experimental y de investigación**. --- ## 📝 **Dataset Summary** Este dataset contiene datos sintéticos diseñados para simular interacciones ficticias de usuarios. Está optimizado para prácticas de análisis de datos, experimentación en ciencia de datos y prototipos de machine learning. No debe utilizarse para aplicaciones comerciales ni para la creación de perfiles reales. --- ## 📊 **Estructura del Dataset** El dataset incluye las siguientes columnas: | Columna | Tipo | Descripción | | ----------------------------------- | ---- | ----------- | |`customer_id` |string| Identificador único del cliente. | `inapp_purchases_1m`, `inapp_purchases_3m`, `inapp_purchases_6m`, `inapp_purchases_12m` | Int | Cantidad de compras en app por periodo.| | `device_model` | string | Modelo del dispositivo más utilizado.| **Obs:** Las columnas numéricas si tienen un valor `-` significa el número `0`. --- ## 📂 **Formato de los Archivos** El dataset se encuentra formato **`TXT`**. --- ## 📥 Cómo Cargar el Dataset desde Hugging Face ### 🔹 Única Opción: 1. Usando `datasets.load_dataset`: ```python from datasets import load_dataset ds = load_dataset("hpestrellag/inapp_activity") ds ```` 2. Convertir a Pandas: ```python import pandas as pd # Pasar el split "train" a DataFrame df = ds["train"].to_pandas() # Reemplazar df por la versión separada por tabs df = df["text"].str.split("\t", expand=True) # Usar la primera fila como nombres de columnas df.columns = df.iloc[0] # Quitar la fila de encabezados y resetear índice df = df.iloc[1:].reset_index(drop=True) df.head() ``` --- ## 🔐 **Licencia** Este dataset se publica bajo la licencia: # **Creative Commons Atribución-NoComercial 4.0 (CC BY-NC 4.0)** ### Permisos y restricciones: ✔️ **Permitido**: * Uso académico * Investigación * Prototipos no comerciales * Uso personal o educativo ❌ **No permitido**: * Uso comercial * Integración en productos de pago * Proyectos que generen ingresos directos o indirectos 🔗 Licencia completa: [https://creativecommons.org/licenses/by-nc/4.0/](https://creativecommons.org/licenses/by-nc/4.0/) --- ## 📚 **Cómo Citar Este Dataset** ```bibtex @misc{estrella2025_inapp_activity, title = {inapp\_activity}, author = {{Pavel Estrella G.}}, year = {2025}, publisher = {Hugging Face Datasets}, howpublished = {\url{https://huggingface.co/datasets/hpestrellag/inapp_activity}}, note = {Dataset sintético generado para investigación. Licencia CC BY-NC 4.0.} } ``` --- ## ⚠️ **Notas Sobre Datos Sintéticos** * No representan individuos reales. * No fueron obtenidos de personas, empresas o fuentes externas. * No contienen información sensible. * Se generaron enteramente mediante métodos estadísticos y modelos de IA. * No deben utilizarse para tareas que requieran datos reales (marketing, segmentación real, perfiles reales). --- ## 👤 **Autor** **PAVEL ESTRELLA G.**
提供机构:
hpestrellag
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作